Genie 2 של גוגל הוא מודל AI חדש – מה הוא יודע לעשות?
מודל הבינה המלאכותית שפותח על ידי דיפ מיינד - ארגון המחקר של החברה לתחום ה-AI - מסוגל לייצר עולמות גרפיים תלת-ממדיים באמצעות תמונה אחת ותיאור טקסטואלי ● באילו תחומים ניתן להיעזר בו?
מודל בינה מלאכותית חדש של גוגל – או יותר נכון של דיפ מיינד (Google DeepMind), שהוא ארגון המחקר של החברה לתחום הזה – מסוגל לייצר עולמות גרפיים תלת-ממדיים באמצעות תמונה אחת ותיאור טקסטואלי. המודל קיבל את השם Genie 2, וכמו ששמו רומז הוא ממשיך דרכו של Genie שהושק מוקדם יותר השנה.
Introducing Genie 2: our AI model that can create an endless variety of playable 3D worlds – all from a single image. 🖼️
These types of large-scale foundation world models could enable future agents to be trained and evaluated in an endless number of virtual environments. →… pic.twitter.com/qHCT6jqb1W
— Google DeepMind (@GoogleDeepMind) December 4, 2024
לפי החברה המודל יכול ליצור, כאמור, סצנות תלת-ממדיות שהן לא לתצוגה בלבד: הן יכולות להיות אינטראקטיביות, כך שהן יכולות לשמש לצורך משחקים אינטראקטיביים – עולמות בהם המשתמשים יכולים לבצע פעולות עם אלמנטים בתצוגה באמצעות עכבר או מקלדת. המודל מאומן אמצעות סרטונים, ולכן הוא מסוגל, לפי החברה, לדמות אינטראקציות של אובייקטים, אנימציות, תאורה, פיזיקה, השתקפויות ואפילו דמויות במשחק שאינן ניתנות שליטה בידי השחקן עצמו.
Genie 2 יכול ליצור עולמות בפרספקטיבות שונות
דיפ מיינד לא חשפה פרטים רבים מדי על הדרך בה היא השתמשה כדי לאמן את המודל החדש שלה, ובאיזה מקורות מידע היא השתמשה, אבל מהדוגמאות שהיא כן הראתה כמעט שאין ספק שהיא עשתה שימוש בסרטונים של משחקי AAA – והרי גוגל כבר רמזה בעבר שתנאי השימוש שלה ביוטיוב מאפשרים לה להשתמש בתכנים שמועלים אל השירות לצורך אימון כלי הבינה המלאכותית שלה, וממש לא קשה כמובן למצוא סרטונים של משחקיות שמועלים לשם אם בידי החברות שמפתחות את המשחקים ובין אם בידי מבקרים וסוקרים.
בחברה טוענים ש-Genie 2 יכול ליצור עולמות בפרספקטיבות שונות, כמו אפשרות לעבור במשחק בין מצב גוף ראשון למצב גוף שלישי, וליצור את העולם בקצב מהיר, כמעט בזמן אמת, מה שכמובן יכול לאפשר בשינויים קלים ליצור עולם משחק מעט שונה בכל פעם שנכנסים למשחק.
"Genie 2 מגיב בצורה חכמה לפעולות שבוצעו על ידי לחיצה על מקשים במקלדת, זיהוי הדמות וההזזה הנכונה שלה. לדוגמה, המודל שלנו יכול להבין שמקשי החצים צריכים להזיז רובוט ולא עצים או עננים", נכתב בבלוג של דיפ מיינד.
בחברה מתייחסים למודל החדש עדיין ככלי ניסוי ויצירה ראשוני, ולא מתיימרים ליצירת עולמות משחק מלאים. כנראה שגם זה יגיע.
תגובות
(0)