אנבידיה השיקה את Grace – מעבד הדטה סנטרים הראשון שלה

המעבד החדש נבנה עבור האצת מודלים של מחשוב על ומודלים גדולים במיוחד של AI ● גלעד שיינר, סגן נשיא בכיר למחשוב על וקישוריות באנבידיה: "המערכות של היום מגבילות אותנו ולא מאפשרות הרצת מודלים עתידיים; משם נולד Grace"

גלעד שיינר, סגן נשיא בכיר למחשוב על וקישוריות באנבידיה. צילום: יח"צ

"אם מסתכלים על הגודל של מודלים של בינה מלאכותית, לדוגמה הבנה ותרגום של שפות – אלה עולים בצורה מעריכית. אם בוחנים מודל של גוגל מ-2019 רואים שכמות המשתנים היא כ-340 מיליון. ב-2021, שנתיים מאוחר יותר, מודל של מיקרוסופט ו-Open AI הראה כי מדובר בזינוק של כמעט פי 1,000. זה אומר שמשנה לשנה אפשר לעשות דברים מדהימים יותר, עד בינה מלאכותית שיכולה פשוט לכתוב קוד מכמה הגדרות שנותנים לה", כך אמר גלעד שיינר, סגן נשיא בכיר למחשוב על וקישוריות באנבידיה.

שיינר דיבר בתדרוך שערכה היום (ג') החברה לכבוד אירוע הבינה המלאכותית השנתי שלה, GTC 2021, שבו היא הכריזה על מגוון רחב של מוצרים. ההכרזה המרכזית הייתה על Grace – מעבד הדטה סנטרים הראשון של החברה, שנבנה במיוחד עבור האצת מודלים של מחשוב על ומודלים גדולים במיוחד של בינה מלאכותית.

הוא הציג כמה דוגמאות לשימושים שניתן לעשות באמצעות Grace: תמצות מסמכים, ביצוע שיחה מלאה, הבנת דיבור ומענה מדויק, בניית מבחנים מבוססי טקסט והגשת אירועי ספורט בטלוויזיה, ברדיו או באינטרנט. "השימושים הולכים ומתפתחים, והמודלים עבור השימושים הללו גדלים. נגיע די מהר למודלים של טריליון משתנים, וכדי להריץ אותם זקוקים ליותר מ-GPU אחד. לכן, העולם עובר למערכות שבנויות על הרבה מאוד מעבדים גרפיים, שיריצו מודלים של בינה מלאכותית", אמר שיינר. "אולם, יש שני צווארי בקבוק: הראשון הוא המעבד והקישוריות שלו למעבדים הגרפיים, והשני הוא הזיכרון שיש במערכות. המערכות של היום מגבילות אותנו ולא מאפשרות הרצת מודלים שנצטרך להריץ בשנים הקרובות. משם נולד Grace".

מעבד ה-Grace של אנבידיה. צילום: יח"צ

מעבד ה-Grace של אנבידיה. צילום: יח"צ

המעבד קרוי על שם חלוצת המחשוב האמריקנית גרייס הופר ומבוסס על מערך ליבות צריכת אנרגיה נמוכה של ARM. לפי אנבידיה, הוא מציע שיפור של עד פי 10 בביצועים במשימות של אימון מודלי בינה מלאכותית ענקיים, כאשר מטרתו היא לספק פתרון ליישומים התובעניים ביותר, כולל עיבוד שפה טבעית, מערכות המלצה ומחשוב על מבוסס בינה מלאכותית.

"חברת שלושת השבבים"

ג'נסן הואנג, מייסד ומנכ"ל אנבידיה, אמר בהכרזה עצמה כי " Grace הוא מעבד שעוצב במיוחד עבור חישובי בינה מלאכותית תובעניים ומחשוב עתיר ביצועים. בשילוב עם המעבדים הגרפיים ויחידות העיבוד (DPU) של אנבידיה, Grace מספק לנו את הצלע השלישית בטכנולוגיות המחשוב, ומעניק את היכולת לתכנן מחדש את הדטה סנטרים לביצועי בינה מלאכותית מתקדמים. אנבידיה היא עכשיו חברת שלושת השבבים".

הקישוריות בין המעבד הראשי למעבדים הגרפיים מבוצעת באמצעות טכנולוגיית NVLink, המאפשרת העברת מידע בקצב של 900 מגה-ביט לשנייה – שזה, לפי החברה, עד פי 14 מהמקובל בשוק. בנוסף, מתאפשרת הכפלת מהירות העברת המידע בין השבבים הגרפיים לבין עצמם.

"זה אומר שהמעבד הראשי יוכל לגשת לזיכרון של המעבד הגרפי באותה מהירות כמו שהמעבד הגרפי יכול, וזה אומר שנוכל להגדיל מאוד את נפח זיכרון העבודה הכולל ולהוריד צווארי בקבוק. זאת, בין היתר בזכות האימוץ וההתאמה של השימוש בזיכרון המובייל LPDDR5x החדש. הדבר יאפשר לקצר זמנים של אימון, עם הרצה בשלושה ימים במקום בחודש, והגעה להסקת מסקנות בזמן אמת על בסיס מודלים של חצי טריליון פרמטרים", ציין שיינר.

הראשונים להכריז על השימוש ב-Grace לטובת הקמתו של מחשב על עבור מאמצי מחקר מדעי הם המרכז הארצי למחשוב על בשווייץ (CSCS) ומשרד האנרגיה האמריקני, במעבדות הלאומיות בלוס אלמוס.

הכרזות נוספות

מעבר למעבד החדש, אנבידיה הכריזה באירוע, בין השאר, על BlueField 3 – יחידת עיבוד לדטה סנטרים מהדור הבא, שמיועדת למעבדים שמפותחים בעיקר על ידי עובדי מלאנוקס בישראל. היחידה תציע שדרוג משמעותי של קצב העברת הנתונים ל-400 מגה-ביט לשנייה. לפי החברה, יחידת BlueField 3 אחת תספק ביצועים שווי ערך ל-300 ליבות של מעבדים ראשיים – מה שמאפשר לפנות מהמעבדים בדטה סנטרים נפחי עבודה קריטיים לטובת הרצת יישומים חשובים אחרים.

ה-DPU החדש מציע ביצועים משופרים עד פי 10 לעומת הדור הקודם והאצה של עד פי ארבעה בביצועי קריפטוגרפיה, והוא תומך בדור החמישי לטכנולוגיית PCIe. ה-BlueField 3 יהיה זמין לבדיקות החל מהרבעון הראשון של 2022.

מעבד ה-Atlan של אנבידיה. צילום: יח"צ

מעבד ה-Atlan של אנבידיה. צילום: יח"צ

הבינה המלאכותית באה לידי ביטוי גם בשוק הרכב המודרני, ואחת ההכרזות של אנבידיה באירוע הייתה על מעבד חדש בסדרת ה-Drive שלה. המעבד החדש, Atlan שמו, אמור להשתלב ברכבים ב-2025. הוא מציע עד 1,000 טריליון ביצועים בשנייה, וזאת לעומת מעבד ה-Orin, שעתיד להציע לאחר צאתו לשוק בשנה הבאה 256 טריליון פעולות בשנייה. ה-Atlan מבוסס על ליבות ARM חדשות, ארכיטקטורת עיבוד גרפי מתקדמת, ומאיצי לימוד מעמיק וראייה ממוחשבת חדשים.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים