בוב פיצ'יאנו, יבמ: "הנתונים והמידע הופכים לסחורה לכל דבר"
"מה שייצור את הבידול בין ארגונים בהיבט הטיפול בנתונים, הפיכתם למידע ובניית תובנות על בסיסם תהיה השאלה כמה מהר מסוגלים להפיק את התובנות האלה", אמר בוב פיצ'יאנו, מנהל תחום ניהול הנתונים בענק הכחול ● לדבריו, "במקרה של פיתוח תמונה היקפית מלאה של הלקוחות, גם אם מפעילים מערכת מידע ראשית, המכילה קבצי נתונים, יש צורך בשילוב מידע ממקורות חיצוניים ומרשתות חברתיות"
"הנתונים הופכים לסחורה לכל דבר, המידע הופך לסחורה ואפילו התובנות המופקות ממנו הן סחורה. מה שייצור את הבידול בין ארגונים בהיבט הטיפול בנתונים, הפיכתם למידע ובניית תובנות על בסיסם תהיה השאלה כמה מהר מסוגלים להפיק את התובנות האלה", כך אמר בוב פיצ'יאנו, מנהל תחום ניהול הנתונים ביבמ (IBM).
פיצ'יאנו, שהתראיין לדאג הנשן, העורך הראשי של InformationWeek, מאמין ששרתי Hadoop יחליפו טכנולוגיות קיימות לטיפול בעומסי עבודה מסוימים ולא מייחס אותה חשיבות לבסיסי נתונים בטכנולוגיות NoSQL ול-SAP HANA.
לדבריו, "יותר מ-3,000 פרויקטים אותם ביצענו אצל לקוחות בעזרת סל מוצרי ה-Big Data שלנו התנקזו כמעט תמיד אל אחד מחמישה תחומי יישום: פיתוח תמונה היקפית מלאה של לקוחות (360 מעלות), תובנות מתוך ניתוח אנליטי של תהליכי תפעול, התמודדות עם איומי אבטחת מידע והונאות, ניתוח נתונים שלא נתפסו עד כה כבעלי ערך שימושי והפחתת עומסים ושילוב מחסני נתונים". הוא אמר ש-"אחדים מתחומי השימוש האלה מתאימים לטכנולוגיית Hadoop יותר מאחרים. אם חושבים על בחינת סוגים חדשים של נתונים, ובכלל זה כמויות גדולות של מידע לא מובנה, אין הגיון בהמרת הנתונים לפורמט מובנה כדי לאחסן אותם במחסן נתונים. עדיף להשתמש לצורך זה ב-Hadoop. יש ליבמ את מערכת Data Explorer, שמסייעת במפתוח ובחלוקה לקטגוריות של מידע לא מובנה, באופן המאפשר לנווט בו, להציג אותו בפורמט חזותי, להבין אותו ולבחון את המתאם שלו עם נתונים אחרים".
"ניתוח אנליטי תפעולי הוא תחום שימוש נוסף שמתאים ל-Hadoop", אמר פיצ'יאנו. "זה עתה הצגנו מוצרים ושירותים חדשים הנשענים על סביבת הענן החכם וסביבת התשתיות החכמות שלנו. הם מתמקדים בסיוע ללקוחות לשלוף ולנתח נתוני לוגים, כדי לזהות אירועים שיכולים לסייע לשיפור העמידות והביצועים של מערכות תפעוליות".
הוא ציין ש-"במקרה של פיתוח תמונה היקפית מלאה של הלקוחות, גם אם מפעילים מערכת מידע ראשית, דוגמת CRM, המכילה קבצי נתונים, עדיין יש צורך בשילוב מידע ממקורות חיצוניים ומרשתות חברתיות. כל אלה הם במידה רבה עניין לעומסי נתונים האופייניים ל-Hadoop".
לדברי פיצ'יאנו, אחת היכולות הייחודיות של הענק הכחול נוגעת לניתוח אנליטי של זרם הנתונים עצמו (Streaming analytics), עוד לפני אחסונם. "אם צריך לשפוך את הנתונים אל תוך אגם גדול בדמות Hadoop ורק אז לחקור את המידע, תעלה רק לאחר שמבינים כמה מהר מסוגלים להפיק את הנתונים האלה הסוגיה 'האם זו הדרך הנכונה לשאול את השאלה הזו?' לעומת זאת, ניתוח אנליטי, שמתבצע כבר על זרם הנתונים עצמו, מאפשר לשאול שאלות חשובות באופן רצוף".
BLU Acceleration לבסיס הנתונים של יבמ
באחרונה הציגה יבמ את BLU Acceleration לבסיס הנתונים שלה, DB2. מהלך זה נועד לענות על הצורך של חברות להתמודד עם מחסני נתונים גדולים במיוחד. פיצ'יאנו ציין את היכולת של BLU Acceleration לפעול בתוך הזיכרון ולהריץ שם טבלאות טוריות במסגרת מערכת הניהול של DB2. "ככל שעומסי עבודה דורשים ניתוח אנליטי וטיפול בדו"חות, ניתן להשתמש בטבלאות BLU על מנת להבטיח ביצועים מיטביים", אמר. "לצד BLU, יבמ ממשיכה להציע את נטזה (Netezza), כמאיץ בסיסי נתונים המתאים לנפחים גדולים ומגוונים במיוחד של מידע. הוא עבר לאורך השנים כוונון מיוחד לעומסי עבודה מוגדרים, דוגמת עולם הקמעונות או ניתוח רשומות בחברות תקשורת. אנחנו מייעדים את נטזה לנפחי נתונים ברמות של פטה-בייטים, בעוד ש-BLU פונה למחסני נתונים של עד 50 טרה-בייט".
בהתייחסו למתחרים אמר פיצ'יאנו, כי "אני מעריך שבסיסי נתונים בטכנולוגיות NoSQL מתאימים ליישומים בפלח השוק התחתון. בסיס הנתונים של SAP HANA מוגבל ביכולותיו והוא בעל עלויות גבוהות, בשל התאמתו לפעולה בזיכרון בלבד והעדר יכולת להשתמש בדיסק בזמן ביצוע הניתוח". הוא הוסיף ש-"נמשיך להרחיב את התמיכה ב- Hadoop, אך לא נזניח טכנולוגיות וקווי עסקים קיימים לטובתה. אני מאמין בערך אותה מציעה Hadoop ללקוחות, גם אם מדובר בשינוי פני שוק מחסני הנתונים, בזכות היכולת לבצע ניתוח בזמן אמת".
הוא סיים באומרו, כי "זה מאיים על שחקני אחסון מסוימים, משום שאתה קובע באופן חכם מהם הדפוסים המעניינים אותך במקום לנסות ולבנות מאגרים גדולים יותר. אנחנו עושים זאת לא משום שאנחנו מאמינים שמדובר באתגר אינטלקטואלי, אלא משום שיש כאן ערך ללקוחות".
תגובות
(0)