גוגל השיקה את Gemini – התשובה שלה ל-GPT
שנה ושבוע אחרי ההשקה של ChatGPT, גוגל משדרגת את יכולות ה-AI שלה ומשיקה מודל חדש, שגרסה אחת שלו כבר מוטמעת בכלי ה-GenAI שלה, Bard ● מה הוא כולל? ומתי הגרסה הבכירה מבין השלוש תגיע ל-Bard?
גוגל השיקה היום (ד') את מודל ה-AI החדש שלה, Gemini, שלדברי המנכ"ל, סונדאר פיצ'אי, פותח "עידן חדש עבור החברה". ההשקה מגיעה שנה ושבוע אחרי יציאתו לאוויר העולם של הכלי שבישר את מהפכת הבינה המלאכותית היוצרת – ChatGPT של OpenAI. היא בוצעה היום על אף דיווחים שפורסמו לפני ימים אחדים, שבהם החברה התחרטה על כוונתה להשיק את Gemini השבוע ודחתה את מועד ההשקה לחודש הבא.
Gemini מאפשר שיחה באמצעות טקסטים, אימאג'ים, וידיאו, אודיו וקודים. הגרסה הראשונה, Gemini 1.0, כוללת שלושה מודלים – Ultra ,Pro ו-Nano. יחד עם ההודעה על Gemini גוגל מסרה כי כלי ה-GenAI שלה, Bard, שהושק בתחילת פברואר, כולל כבר עכשיו את מודל ה-Pro, ובתחילת השנה הבאה היא תשיק את הגרסה המתקדמת של Bard עם מודל ה-Ultra בתוכה.
בגוגל מציגים תוצאות של בדיקות בנצ'מרק "מקובלות בתעשייה", לדבריהם, שחטיבת ה-DeepMind שלה העבירה את מודל ה-Pro אל מול GPT 3.5, וטוענים, איך לא, שהמודל שלהם טוב יותר. כך, הם מציינים, במדד של MMLU (הבנת שפה רב משימתית מסיבית), התקן המוביל למדידת מודלים גדולים של AI, המודל שלהם קיבל 1.8 נקודות יותר מהמתחרה. בבדיקת GSM8K, שבה מודלים פותרים בעיות מתמטיות ברמת חטיבת ביניים, Gemini Pro קיבל 29 נקודות יותר מ-GPT 3.5.
סדרת בדיקות נוספת שהחטיבה ביצעה העמידה את מודל ה-Ultra אל מול GPT-4V. בסדרה זו, מדד ה-MMLU של המודל הגוגלי זכה ב-3.6 נקודות יותר מאשר המודל המתחרה, ובבדיקת GSM8K – ב-2.4 נקודות יותר. בדיקה שבה ה-GPT זכה לציון גבוה יותר גם אצל גוגל היא ה-HellaSwag – מתן סיבות למשימות יומיומיות, שמתבססות על היגיון ישר.
"המטרה: להפוך את Bard לכלי ה-AI השימושי ביותר בעולם"
על פי גוגל, "כשהטמענו את Gemini Pro ב-Bard שמנו דגש מיוחד על יכולות הבנה, תמצות, הסקת מסקנות, סיעור מוחות, כתיבה ותכנון. והתוצאות מצוינות: כשנותנים למדרגים מצד שלישי להשתמש בצ'טבוטים לא מזוהים, הם מעדיפים את Bard על פני החלופות המובילות".
עוד נמסר בהודעת החברה כי "Gemini מקרב אותנו צעד נוסף למימוש החזון שלנו להפוך את Bard לכלי ה-AI השימושי ביותר בעולם. אנחנו ממשיכים לשכלל ולשפר את Bard בכל הזדמנות, ורואים אותו יוצר, לומד ומתפתח".
"המודל בעל היכולות הרבות ביותר של גוגל עד כה"
לדברי פיצ'אי, "עכשיו אנחנו צועדים עוד צעד במסע ה-AI שלנו, עם Gemini, שהוא המודל הכללי ובעל היכולות הרבות ביותר שלנו עד כה. מבחני בנצ'מרק רבים הוכיחו שיש לו ביצועים מצוינים (State of the art)". בפוסט שפרסם בבלוג של גוגל הוא כתב כי שלושת המודלים שהחברה השיקה הם "המודלים הראשונים של עידן ה-Gemini וההוצאה לפועל הראשונה של החזון שהיה לנו כשהקמנו את חטיבת DeepMind מוקדם יותר השנה. העידן החדש הזה של מודלים מייצג את אחד המאמצים המדעיים וההנדסיים שלקחנו על עצמנו, כחברה. אני מצפה לראות מה צופן העתיד ואת ההזדמנויות ש-Gemini יביא איתו לאנשים בכל מקום".
דמיס הסאביס, מנכ"ל ומייסד משותף של חטיבת DeepMind, כתב בפוסט ש-Gemini "נבנה מאפס כדי להיות רב מודאלי, מה שאומר שהוא יכול להכליל ולהבין בצורה חלקה, ולפעול על פני ולשלב סוגים שונים של מידע, כולל טקסט, קוד, אודיו, תמונה ו-וידיאו".
"Gemini הוא גם המודל הכי גמיש שלנו עד כה", הוסיף הסאביס. "הוא יכול לרוץ ביעילות על כל דבר מדאטה סנטרים ועד למכשירי מובייל. היכולות שלו ייטיבו מאוד את הדרך שבה מפתחים ולקוחות של ארגוני אנטרפרייז יבנו ויצמחו באמצעות AI. הוא יאפשר לקדם את היצירתיות והמדע, להרחיב את הידע ולשנות את הדרך שבה מיליארדי אנשים ברחבי העולם חיים ועובדים".
תגובות
(0)