עתיד המידע המורכב בעסקים
אל תופתעו אם ב-2016 חברות יפסיקו לתחזק פס ייצור של כלי תוכנה ייעודיים לצרכי אנליזה, שכן המגמה של מציאת פתרונות אינטגרטיבים תגדל באופן ליניארי עם כמות ומורכבות המידע שארגונים צריכים לנתח
גרטנר (Gartner) מפרסמת מדי שנה את מדד התועלת העסקית לטכנולוגיות מתפתחות (ה-Hype cycle for emerging technologies)- כלומר, המדד מעריך את מידת הבשלות, התועלת העסקית והיתרונות העסקיים של טכנולוגיות מסוימות. החברה טוענת כי כל טכנולוגיה מתקיימת במחזוריות של חמש-עשר שנים: החל מציפיות מופרזת, המשך בהתפכחות ולבסוף בהתקבעות של הטכנולוגיה סביב שימושים עסקיים קונקרטיים.
השנה, לאחר מספר שנים שבהן ה-Big Data תפס מקום מרכזי בניתוחים הללו של גרטנר (ראו בתמונה שלעיל, מ-2014), בחרו האנליסטים שלא לכלול אותו ב-hype cycle. ההסבר שניתן לכך הינו שה-Big Data עבר במהרה את "פסגת הציפיות המופרזות", ובשנת 2015 הוא כבר נפוץ בתחומים רבים בחיי היומיום.
אנחנו מקבלים את הקביעה של גרטנר – אכן, עם סיום שנת 2015, Big Data איננו יכול להיחשב עוד לטכנולוגיה נישתית או צומחת. במובנים רבים, כיום כמעט כל ארגון בינוני ומעלה מתעסק בצורה כזו או אחרת, בעיבוד וניתוח כמויות גדולות של נתונים אשר נצברים במהלך הפעילות העסקית שלו. אך בתוך עולם ה-Big Data, הבינה העסקית והאנליטיקה כבר מסתמן האתגר הגדול הבא, ובצידו גם הזדמנות גדולה: תחום דטה מורכב (complex data).
מהו דטה מורכב ולמי יש אותו?
ישנם שני גורמים עיקריים שהופכים דטה למורכב:
● גודל – זהו Big Data במובן המילולי: מספר רב מאוד של רשומות שיוצרות מאגרי מידע גדולים, בין שהמדידה היא בגודל פיזי – כמה מקום המידע תופס על השרת (גיגה/טרה-בייט), ובין שהיא טבלאית – מכמה טבלאות, עמודות ושורות מורכב המידע. הגודל עצמו מהווה אתגר, שכן עיבוד המידע מחייב הקצאת משאבים חישוביים רבים יותר על מנת לעבד את המידע ולבצע חישובים עליו.
● מספר מקורות המידע – גורם עיקרי שהופך מידע למורכב, הינו כמות מקורות המידע אשר מרכיבים את מאגר הנתונים הסופי. זאת, משום שכל מקור כזה מדבר ב"שפה" אחרת, הינו בעל מאפיינים אחרים, מקום אחסון שונה, וכו'. ניסיון להפיק תובנות מתוך השילוב של מספר רב של מקורות מידע מהווה אתגר כיוון שיש לבצע אינטגרציה של המקורות השונים ולהגיע למצב שישנה "גרסה יחידה של האמת" בארגון. משמעות הדבר היא השקעת משאבים אנושיים וחישוביים רבים יותר בהכנת המידע לניתוח, לפני שניתן להסיק מסקנות מתוכו.
דטה מורכב הוא כזה שמתקיימים לגביו שני המאפיינים שלעיל – כמות גדולה של מידע, אשר מגיע ממספר רב של מקורות. במקרה כזה האתגר הוא כפול: גם הצורך לעבד כמות גדולה של נתונים, בנוסף לצורך לבצע אינטגרציה של מספר רב של מקורות אשר לעתים הינם שונים האחד מן השני בתכלית השינוי.
בד בבד, כמות גדלה והולכת של חברות מגלה שהמידע שבידיהן עונה להגדרה הנ"ל של מורכבות, בעיקר נוכח הופעתם של מקורות מידע חדשים והתפתחותן של טכנולוגיות חדשות לאיסוף ואגירת מידע. כך לדוגמא, מידע שנוצר על ידי מכונות (machine data) ומידע שמקורו באינטרנט של הדברים – לפני כעשור מעטים סברו שיהיה ערך למידע מסוג זה במסגרת ניתוחים של בינה עסקית, אך כיום הולך ונהיה מרכיב עיקרי מתוך פרויקטים כאלה. כבר היום, מחקר של חברת הייעוץ ונטאנה (Ventana Research) מצא ששלוש מתוך חמש חברות צריכות לשלב בין שישה מקורות מידע או יותר.
הפתרון הנוכחי: ביזור
כיצד, אם כן, מתמודדים עם מידע מורכב? הדרך המסורתית היא באמצעות חלוקת המשימה של ניתוח המידע לתתי-חלקים וביזור כל חלק כזה לכלי אחר: מאגרי נתונים, מחסני מידע (data warehouses), כלי טרנסופרמציה (ETL), וכלים נוספים לויזואליזציה ותצוגה גרפית של המידע. כך שכל פיסת דטה עוברת דרך כל אחד מהשלבים הללו ב"פס הייצור", עד שלבסוף המידע מגיע לתצורה שבה אנליסטים יכולים לייצר מתוכו תובנות עסקיות.
למרות שגישה זו מספקת תוצאות סבירות, היא סובלת ממספר חסרונות:
● מחיר: כל כלי כאמור בדרך כלל נושא תג מחיר משלו, ולעתים – מדובר במחיר גבוה למדי, כיאה למוצרי תוכנה המיועדים למגזר העסקי.
● תחזוקה: כוח אדם ייעודי נדרש להקדיש משאבים על מנת לתחזק כל אחת מהמערכות בנפרד, ואת ערוצי התקשורת והאינטרגרציה ביניהן.
● מורכבות: האפשרות להשתמש במערכת מסוג זה, אשר בנויה מטלאי של מספר כלים נפרדים, שמורה למשתמשים בעלי הבנה טכנית רבה, ובדרך כלל לקבוצה של משתמשים (לדוגמא, מחלקת ה-IT תהיה אחראית ל-back-end של המערכת בעוד שאנליסטים יעסקו בניתוח המידע עצמו). התפקיד של המשתמשים העסקיים הוא של צרכנים פאסיביים, והם אינם יכולים לנתח מידע או לייצר דו"חות בעצמם.
גישה חלופית: כלים אינטרגטיביים
כנגד גישת הביזור, אנחנו מציעים ומקדמים את גישת האינטגרציה: שימוש בכלי אחד שמשמש כמערכת BI שלמה על כל חלקיה, החל מהכנת המידע, עיבודו, ביצוע חישובים ותצוגה ויזואלית של התוצאות. כך נחסכות הבעיות שלעיל, כאשר לארגון יש כלי אחד לרכוש, לתחזק ולתפעל על מנת לענות על כל צרכיו בתחום ניתוח ותצוגה של מידע.
כלים מסוג זה שונים מן הכלים המסורתיים בכך שהם צריכים להיות בנויים מלכתחילה לעמוד באתגרים של דטה מורכב. הם צריכים להתבסס על טכנולוגיה שתאפשר להם לעבד כמות גדולה של נתונים בצורה מהירה, אך גם לשלב בין מקורות מידע שונים בהתאם לצורך – כולל "למשוך" את הנתונים אל תוך המערכת, ולחבר בין טבלאות שונות בתוך המידע בצורה חלקה ומבלי לאבד חלק מן הנתונים תוך כדי התהליך.
חרף האתגרים הטכנולוגיים (אשר גם להם יש פתרונות), אנו מאמינים שגישה אינטגרטיבית יכולה לתת לארגונים פתרון פשוט לדטה מורכב, להפחית מן המעמסה על מחלקת ה-IT ולאפשר למשתמשים עסקיים להפיק בעצמם ערך מתוך מידע מסוג זה, בחלק גדול מן המקרים. לא נתפלא אם בשנת 2016, ובוודאי בשנים לאחריה, חברות יפסיקו לתחזק פס ייצור של כלי תוכנה ייעודיים לצרכי אנליזה, שכן המגמה של מציאת פתרונות אינטגרטיבים תגדל באופן ליניארי עם כמות ומורכבות המידע שארגונים וחברות צריכות לנתח.
הכותב הינו סמנכ"ל השיווק בסייסנס (Sisense).
תגובות
(0)