IDC: השנה ייווצר מידע בנפח 1.8 זטה בייט; כמות המידע בעולם יותר ממכפילה את עצמה מדי שנתיים
על פי המחקר, שנערך במימון EMC, בעשור הקרוב ינהלו ארגונים פי 50 יותר מידע וכמות הקבצים תגדל פי 75 ● למרות זאת, כמות אנשי ה-IT תגדל רק פי 1.5 ● החוקרים מעריכים, כי היקף המידע המיוצר השנה יכול היה למלא 57.5 מיליארד מכשירי iPhone בעלי נפח של 32 ג'יגה-בייט, לאפשר בנייה של החומה הסינית באמצעות מכשירי iPad, בגובה הכפול מגובה החומה הקיימת או לבנות הר הגבוה פי 25 מגובהו של הר הפוג'י ביפן
כמות המידע בעולם יותר ממוכפלת מדי שנתיים, וב-2011 ייווצר וישוכפל מידע בנפח עצום של 1.8 זטה-בייט (1.8 טריליון ג'יגה-בייט, או 1.8 מיליון פטה-בייט), מהר יותר מחוק מור – כך עולה מתוצאות מחקר היקום הדיגיטלי (Digital Universe) שערכה חברת המחקר IDC, במימון EMC. המחקר נושא את הכותרת "הפקת ערך מהכאוס". המספר המתאר את נפח המידע שייווצר השנה, בבייטים, ייראה כך: 1,800,000,000,000,000,000,000.
המחקר, שנערך זו השנה החמישית, מודד ומנבא את כמות המידע הדיגיטלי שנוצר ומועתק מדי שנה ומנתח את השלכות הממצאים על אנשים פרטיים, ארגונים ואנשי המקצוע בתחום ה-IT, כמו גם את המשמעויות הכלכליות, החברתיות והטכנולוגיות שיש לכך על נתונים גדולים (Big Data) והזדמנויות אחרות.
הוא מעלה, כי כמות המידע שתיווצר השנה גבוהה פי 1.5 מזו שנוצרה בשנה שעברה, שעמדה על 1.2 זטה-בייט (1,227 אקסה-בייט). לשם השוואה, ב-2005 נוצרה ברחבי העולם כמות מידע של 130 אקסה-בייט, ואילו ב-2015, מעריכה IDC, תיווצר כמות של 7,910 אקסה-בייט – פי 6.4 מזו שתיווצר השנה.
מידע בנפח של 1.8 זטה-בייט שווה ערך בהיקפו לשלושה ציוצים בדקה שיצייץ כל אדם בארצות הברית במשך 26,976 שנה, ללא הפסקה, או שלושה ציוצים בדקה שיצייץ כל אדם בישראל במשך 1,081,664 שנים, ללא הפסקה; 215 מיליון צילומי MRI ברזולוציה גבוהה שיעשה כל אדם בעולם ביום אחד; צפייה של אדם אחד במשך 47 מיליון שנים, ללא הפסקה, ביותר מ-200 מיליארד סרטים באורך של שעתיים, ברזולוציה גבוהה (HD).
נפח המידע שייווצר השנה שווה ערך לכמות המידע הנדרשת כדי למלא 57.5 מיליארד מכשירי iPhone בעלי נפח של 32 ג'יגה-בייט. עם כל כך הרבה מכשירי iPhone, ניתן היה: לבנות קיר של מכשירי iPad באורך של 6.5 ק"מ ובגובה של 18.5 מטר; לבנות את החומה הסינית ממכשירי iPad, בגובה הכפול מהגובה הממוצע של החומה המקורית; לבנות קיר בגובה שישה מטרים מסביב לדרום אמריקה; לכסות 86% משטחה של מקסיקו סיטי; או לבנות הר הגבוה פי 25 מגובהו של הר הפוג'י ביפן.
טכנולוגיות חדשות של "מידע מבוית" מוזילות את עלויות יצירת, שמירת, ניהול ואיחסון המידע בשישית לעומת העלויות המקבילות ב-2005. כך, עלות טיפול בג'יגה-בייט מידע עמדה לפני שש שנים על 18.95 דולרים וצפויה לעמוד על 0.66 דולרים ב-2015. נתון נוסף מעלה, כי היקף ההשקעה של ארגונים ביקום הדיגיטלי – מיחשוב ענן, חומרה, תוכנה, שירותים וצוותים – שנועדו ליצור, לנהל, לאחסן ולחולל הכנסות ממידע גדל מאז 2005 ב-50% לסכום של ארבעה טריליון דולרים. ב-2005 עמד היקף ההשקעה על 2.7 טריליון דולרים והוא צפוי להגיע ל-5.2 טריליון ב-2015.
לצל הדיגיטלי יש רצון משל עצמו
במחקר נקבע, כי "המיומנויות, הניסיון והמשאבים הקיימים לניהול מבול הנתונים פשוט אינם עומדים בקצב הצמיחה של כל התחומים". כך, במהלך העשור הנוכחי (עד 2020) יחוו מחלקות ה-IT ברחבי העולם גידול של: פי 10 בכמות השרתים הוירטואליים והפיזיים; פי 50 בנפח המידע שיהיה צורך לנהל; פי 75 בכמות הקבצים או המערכים לשמירת מידע ביקום הדיגיטלי, שגדלה אפילו מהר יותר מאשר המידע עצמו, עם יותר ויותר מערכות משובצות מחשב, בהן חיישנים באביזרי לבוש, גשרים או מכשירים רפואיים. במקביל, כמות אנשי מקצוע בתחום ה-IT שיהיו זמינים לנהל כל זאת תגדל רק פי 1.5.
עוד עולה מהנתונים, כי בעוד שמיחשוב ענן מהווה כיום פחות מ-2% מהוצאות ה-IT כיום, עד שנת 2015, כמעט 20% מהמידע יבוא במגע עם ספקי שירותים של מיחשוב ענן. כלומר, אי שם במסע של הבייט מהיווצרותו ועד סילוקו הוא יהיה מאוחסן או מעובד בענן. באותה עת, עד 10% מהמידע יישמר בענן. פתרונות מיחשוב ענן – ציבורי, פרטי והיברידי – "מספקים לארגונים רמות חדשות של יתרונות עלות פר צמיחה, זריזות וגמישות בהשוואה לסביבות IT מסורתיות", על פי המחקר. "לטווח הרחוק יהיה זה כלי מפתח לניהול המורכבות של היקום הדיגיטלי".
לצל הדיגיטלי יש רצון משל עצמו, על פי IDC. כך, כמות המידע שיחידים יוצרים בעצמם – כמו כתיבת מסמכים, צילום תמונות והורדת מוזיקה – פחותה משמעותית מכמות המידע שנוצר עליהם בעולם הדיגיטלי.
האחריות לכך, קובעת חברת המחקר, היא של הארגונים הגדולים: בעוד ש-75% מהמידע הנמצא בעולם הדיגיטלי נוצר על ידי יחידים, ארגונים נושאים ב-80% מה-"אחריות" על המידע בעולם זה בשלב מסוים בחייהם הדיגיטליים.
עוד עולה מהמחקר, כי כלים חדשים למטרות לכידה, חיפוש, גילוי וניתוח יכולים לסייע לארגונים לקבל תובנות מהנתונים הלא מובנים שלהם, המהווים יותר מ-90% מהעולם הדיגיטלי. כלים אלה מסוגלים ליצור נתונים אודות נתונים או מטה-נתונים באופן אוטומטי.
עם הזמן, נכתב, כלי BI מתמודדים יותר ויותר עם נתונים בזמן אמת, בין אם מדובר בגביית פרמיית ביטוח רכב, בהתבסס על מסלולי נסיעה של אנשים, ניתוב ברשת חכמה או התחלפות מסרים שיווקיים בהתבסס על תגובות ברשתות חברתיות.
זמינות של כלים חדשים לניהול איחסון יכולה להפחית את העלויות של חלק מהעולם הדיגיטלי המאוחסן – כמו מניעת וביטול כפילויות (דה-דופליקציה) ו-וירטואליזציה. כמו כן, כלים אלה מסייעים להחליט מה בדיוק לאחסן מבחינת פתרונות לניהול תוכן.
הצמיחה של היקום הדיגיטלי ממשיכה לעבור את צמיחת קיבולת האיחסון. אולם, על פי הדו"ח, "יש לזכור שג'יגה-בייט של תוכן מאוחסן יכול ליצור לפחות פטה-בייט של נתונים חולפים שאנחנו בדרך כלל לא מאחסנים, כגון אותות טלוויזיה דיגיטלית שאנחנו רואים אבל לא מקליטים ושיחות קוליות שהופכות לדיגיטליות בתשתית הרשת במהלך השיחה".
מחברי הדו"ח סיכמו בכתבם, כי אפשר לומר שפחות משליש המידע ביקום הדיגיטלי הינו בעל רמת אבטחה או הגנה מינימלית. רק כמחצית מהמידע שזקוק להגנה אכן מוגן.
יחד עם זאת, ולמרבה המזל, מחירי האחסון יורדים בקצב העולה על קצב הגידול