OpenAI השיקה את GPT-4o: מודל חדש אנושי, מהיר וחכם בהרבה
כולם התנבאו מה יקרה בהכרזה, אך ביום ב' הפתיעה מפתחת ה-GenAI את העולם עם מודל שפה גדול מגה-משודרג, שיודע למשל לדבר באופן טבעי ומבין היטב ניואנסים ואפילו מהו סרקזם ● בנוסף הושקה גרסת דסקטופ ל-ChatGPT
OpenAI זעזעה השבוע (ב') שוב את עולם הבינה המלאכותית עם השקת GPT-4o – דגם השפה הגדול (LLM) החזק ביותר שיצא לשוק עד כה. מדובר בטכנולוגיה פורצת דרך שמתהדרת בשיפורים משמעותיים במהירות, בביצועים ובנגישות, ומסמנת קפיצת מדרגה גדולה בגזרת ה-AI הג'נרטיבית.
המודל החדש GPT-4o – עליו דיווחה החברה בהרחבה, כולל הדגמות של יכולותיו המופלאות (המופיעות בציוץ X של OpenAI המוטמע למטה, שכדאי מאוד לראות כדי להבין את הבשורה) – מספק שיפור משמעותי בביצועים בהשוואה לקודמיו. כך למשל הוא מצטיין בעיבוד טקסט, לצד יכולות עיבוד של תמונה ושמע. משמע הוא מבין אתכם כשאתם מדברים אליו ומבין גם סרטונים או שידור לייב אם אלו מופיעים מולו.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
אינטראקציות קוליות ובווידיאו בזמן אמת
המודל, שעליו מתבסס הצ'אטבוט איתו המשתמש מתקשר, מציע תגובה סופר מהירה והבנה מרשימה, הכרוכה ביכולת ליצור הקשרים ולהבין ניואנסים. על פי הסרטונים שתיעדו אינטראקציות עם הכלי מבוסס המודל החדש, התוצאות שהוא מפיק הן לא פחות ממעולות. בנוסף, הצ'אטבוט יכול כעת לשוחח עם המשתשמש בשפה טבעית עשירה בטונים והבעה, ממש כמו היה דמות אנושית. תרצו – בן לוויה או חבר.ה טובים, שניתן להתייעץ איתם על דברים. כך למשל, באחד מקטעי ההדגמה שואל משתמש את הבינה המלאכותית שמולו, כשהוא מצלם את עצמו בווידיאו, האם המראה שלו מתאים לראיון עבודה. הבוטית עונה לו שיש לו נראות של מקודד נמרץ שיכולה לסייע לו, אבל היא גם שמה לב, כמו הצופים בני האנוש, ששערו מעט פרוע ומציעה לו לסדר אותו.
אחד הדברים החדשים שהמתשמשים יוכלו לעשות מול הצ'אטבוט זה לנהל איתו אינטראקציות קוליות וכן כאלו בווידיאו בזמן אמת – הדבר מאפשר שיחות טבעיות ודינמיות עם ה-AI. כך למשל, כשמדגים מטעם החברה הראה לצ'אטבוט שהוא יושב עם חבר אשר מולו עוגה עם נר ניצב עליה, הבוט, שבמקרה הזה היה בכלל בוטית עם קול נקבי, ידעה לזהות מיד כי מדובר בחגיגות יום הולדת. היא שרה לחבר שיר ובירכה אותו והכל בתוך צחקוקים, חביבות והענקת תחושה טבעית לחלוטין.
החברה עדכנה כי קלט של טקסט ותמונה במודל החדש ב-API שוחרר כבר במועד ההשקה ביום ב'. הכלי המצופה עוד יותר, ChatGPT על בסיס המודל החדש בלווית אפשרויות התקשור הקולי והמצולם, יתגלגל למשתמשים בשבועות הקרובים.
המודל החדש – חינם לכולם
OpenAI הפתיעה רבים כשכחלק מההכרזה היא עדכנה כי המודל GPT-4o יפתח בחינם לכל המשתמשים, אפילו לאלה בתוכנית החינמית של ChatGPT, משמע שאין צורך לשלם על השימוש בו דמי מנוי פרו. הבחירה הזו של החברה היא שינוי מדיניות מבורך, אחרי שדגמי GPT-4 היו שמורים למנויים משלמים בלבד.
אפשר שגם מהלך זה קשור בעקיפין לתביעתו של אילון מאסק, יזם הטק שהיה אחד ממיסדיה לפני שנים רבות, נגד OpenAI. מאסק תבע את החברה בטענה שהיא הפרה את תוכניותיה המקוריות להיות עמותה שמביאה את כלי ה-AI באופן נגיש וחינמי לכלל הציבור, והפנתה להן עורף ברדיפה אחרי רווחים.
This was a fun one! Take a look at 2 AI agents resolving a customer service claim with #OpenAI new #GPT4o.
Working with customers to build transformational solutions always gets me fired up. The potential solutions we can build with this new SOTA model has my head spinning! pic.twitter.com/86SNgNI6Tl
— Joe Beutler (@JoeBeutler) May 14, 2024
אם לחזור לחידושי GPT-4o הרי שהוא מתגאה גם בתמיכה רב-לשונית משופרת ויכול, לפי החברה, להבין ולהגיב בלמעלה מ-50 שפות שונות , באיכות ובמהירות משופרים.
בנוסף, המפתחים נהנים מ-API מחודש, שהוא לטענת OpenAI, מהיר פי שניים מקודמו ומתומחר בכחצי מהעלות של GPT-4 Turbo. ב-OpenAI טוענים כי ה-API המחודש מאיץ את הפיתוח והיישום של יישומים מונעי בינה מלאכותית.
כלל, נראה כי שחרור ה-LLM החדש של OpenAI גורם למירוץ הבינה המלאכותית לתפס תאוצה גבוהה פי כמה מזו המסחררת בלאו הכי שכולנו רואים בשנה האחרונה. ההתקדמות שרושמת כעת OpenAI מגיעה על רקע תחרות עזה בתעשיית ה-GenAI.
יצוין כי יש מי שטוענים שהמודל לא מרשים אותם ושהוא בסך הכל על תקן סגירת פער שהיה ל-ChatGPT מול הכלי המתחרה, ג'מיני (Gemini AI) של גוגל, כפי שאמר קרייג דיקייט, סגן נשיא ואנליסט בחברת המחקר גרטנר, בשיחה עם InformationWeek. לא ברור ממה נבעה תחושתו של דיקייט ש-ChatGPT היה עד כה נחות מג'מיני מבית גוגל, אבל מספיקה הצצה קטנה על יכולות המודל החדש כדי להבין ולהתרשם מההתקדמות המשמעותית והמאוד מסעירה של הטכנולוגיה.
מנכ"ל OpenAI, סם אלטמן, תיאר את המודל החדש כ"ממשק המחשוב הטוב ביותר שאי פעם השתמשתי בו", והדגיש בדבריו בעיקר כמה הדרך של המודל להתבטא בשפה טבעית ולהתנהל באופן אינטואיטיבי בהרבה משפרת את האינטראקציה עם הצ'אטבוט לאין ערוך.
Sam Altman on GPT-4o's Impact & Use
On the release day of GPT-4o, Sam Altman discussed on The Logan Bartlett Show:
>> Significance of GPT-4o
Major leap in HCI. It's faster, more natural, flexible, and enjoyable.>> How he uses it
He keeps his phone out while working. Instead… pic.twitter.com/7HcJpRmXek— Leeron Zhang (@leeron) May 15, 2024
עוד חידוש: ChatGPT בגרסת שולחן העבודה
OpenAI הציגה גם אפליקציית שולחן עבודה חדשה של ChatGPT, שנועדה לשלב בצורה חלקה את הבינה המלאכותית היוצרת במשימות המחשוב היומיומיות. בגרסה זו המשתמשים יכולים ליצור אינטראקציה עם ChatGPT באמצעות קיצורי מקשים פשוטים, מה שעושה את זה קל מתמיד לשאול שאלות או לבצע פקודות ישירות מהדסקטופ. קצת מאכזבת עם זאת העובדה ששירות זה יהיה זמין תחילה עבור macOS, ושגרסת ה-Windows שלו צפויה רק בהמשך השנה.
לסיכום ניתן לומר כי ניכר שעם GPT-4o, חברת OpenAI סוללת את הדרך לעתיד שבו כלי AI יהיו באמת סופר-נגישים ומועילים לכולם. בנוסף, למרות הביקורת של מאסק, הטכנולוגיה החדשנית של החברה מעצימה כעת מפתחים ומשתמשים כאחד ומטפחת חדשנות בתחומים רבים.
ברור שהמירוץ אחרי התואר 'החברה הדומיננטית ביותר בתחום הבינה המלאכותית' רחוק מלהסתיים, במיוחד כשחברות ענק כמו אפל למשל טרם נכנסו אפילו לתחרות, אבל החידוש מבית OpenAI ללא ספק מעלה את הרף ומציב סטנדרט חדש לאינטראקציה של משתמשים עם כלי הבינה המלאכותית היוצרת.
תגובות
(0)