בעקבות אירוע | Big Data – InfiniteStorage
מאת יאיר גני, TNN / SGI
וודאי לא אגלה לכם דבר אם אומר כי העולם המודרני מושתת על מידע דיגיטלי. הרבה מידע! רק אתמול דיברנו על מגה-בייטים. ואז הגיעו הגיגה-בייטים. מצמצנו קלות – וכבר מדברים על טרה-בייטים. המחשב נייד שלי מכיל כונן קשיח של חצי טרה-בייט ולחלקכם יש טרה-בייט. עם כל המוזיקה, התמונות והסרטים שאנו אוגרים – נראה שבקרוב גם זה כבר לא יספיק.
אז אם בבית אנו כבר מתמודדים עם כמויות עתק של מידע – שערו בדמיונכם עם מה צריכים להתמודד ארגונים המתעסקים עם מסות של מידע. למשל, ארגונים מתעשיית המדיה – כגון בתי Post Production, משרדי פרסום והפקה, זכייני שידור ועוד. אך לא רק הם, בתי-חולים וקופות חולים המתמודדים עם דור חדש של הדמיות, חברות אבטחה העושות שימוש מתוחכם במקורות וידאו רבים וכו'. המעבר לאיכויות משופרות (כגון HD בעולם הטלוויזיה או רזולוציות משופרות בעולם ההדמייה הרפואית) כמו גם עליה במספר מקורת המידע (מספר מצלמות מעקב, מצלמות תנועה ואפילו מספר המצלמות בתכנית ריאליטי בטלויזיה), גרמו לעלייה משמעותית בדרישות ממערכות האיחסון. דרישה זו כבר העמידה ארגונים לא מעטים בפני החלטות קשות. שדרוג מערך האיחסון הקיים באירגון לא יחזיק הרבה זמן – לכן יש לחשוב על פתרון טוב יותר. יתר על כך – הגדלת הנפח (capacity) לא מהווה פתרון לכל הבעיה. יש צורך גם לפתור את עניין הביצועים הנדרשים מהמערכת – ומסתבר שבעיה זו היא הרבה יותר קשה לפתרון.
חברת SGI, המיוצגת בישראל ע"י חברת TNN Telecom, חיה את האתגרים שתוארו לעיל מזה שנים רבות – כמי שמספקת פתרונות לעולם חישוב העל (High Performance Computing) ותעשיית המדיה, לקוחותיה הרבים – בארץ ובעולם – מתמודדים בעזרת הפתרונות שמספקת SGI עם כמויות עתק של מידע – ועם הצורך לשנע אותו במהירות גבוהה, לפעמים עד כדי Real Time. כדי לתת מענה לאתגרים שהוזכרו לעיל, SGI משתמשת ברכיבים של חברת DDN (ר"ת Data Direct Networks), המתמחה בייצור מערכי איחסון בעלי קיבולת גבוהה ועתירי ביצועים. לדוגמה – מערך האחסון SGI InfiniteStorage 16000 מסוגל לעבוד בקצב קבוע (Sustained) של עד 12GB/sec. לא, זו לא שגיאת הדפסה – שניים עשר גיגה-בייט בכל שנייה. כמובן שזה דורש לא מעט דיסקים בתוך מערך האיחסון – ולא במקרה מערכי האיחסון הללו תומכים בעד 1,200 דיסקים תחת מערך בודד – וניתן לערב דיסקים מסוג SAS, SATA ו-SSD.
חומרה טובה איננה מספיקה. יש צורך גם בתשתית תוכנתית טובה שתתמוך בחומרה ותאפשר גישה מהירה ממספר צרכנים – במיוחד אם קיים צורך לשתף קבצים בין כמה צרכני קצה. שרתי קבצים סטנדרטיים לא יעמדו בקצב הנדרש ולכן יש צורך בפתרונות חדישים יותר. אחד המרכיבים החשובים בכזה פתרון הוא מערך הקבצים (File System) – זהו המרכיב המאחסן את הקבצים ומאפשר גישה אליהם. ל-SGI מגוון רחב של פתרונות לאתגרים כאלו. בין הפתרונות אפשר למנות:
• CXFS – זהו Cluster File System מבית SGI הרץ על גבי רשת SAN Fibre Channel
• StorNext – פתרון של חברת Quantum המאפשר עירוב של צרכני רשת רגילים עם צרכני SAN
• Lustre – המדובר ב-Filesystem הלקוח מעולם ה-Open Source ומאפשר גישה מרובה צרכנים "כבדים" לאמצעי אחסון. SGI היא אחת מחברות המיחשוב היחידות שתומכת מבית בפתרונות Lustre.
דוגמה טובה לכך הינה אחת ההתקנות שנעשו בעולם חישוב העל בארץ. מדובר בקבוצת מחקר המסונפת לאחד הפרוייקטים במאיץ החלקיקים הגדול בשויץ. הקבוצה מבוזרת בין שלוש אוניברסיטאות: מכון וויצמן, אוניברסיטת ת"א והטכניון. מערך האחסון של הקבוצה הוא בגודל של כ-1.5 PetaByte. אלו הם אלף וחמש מאות טרה-בייטים או מיליון וחצי גיגה-בייטים! קצב הגישה של המערך נמדד בגיגה-בייטים לשניה.