Google I/O: המלכה הלא מעורערת, איך לא – בינה מלאכותית

ועידת המפתחים השנתית של גוגל יצאה לדרך עם שורה ארוכה מאוד של הכרזות שקשורות לבינה מלאכותית, שחלקן מציעות פתרונות מעודכנים של החברה כדי לתת מענה לכל תחרות קיימת או אפשרית

בינה מלאכותית במרכז ההכרזות של גוגל בכנס המפתחים שלה לשנת 2024.

יום אחרי ש-OpenAI ניסתה לגנוב את ההצגה עם ההכרזה של מודל GPT-4o, ועל רקע הדיווחים על כך שהחברה של סם אלטמן עומדת להציג מנוע חיפוש מבוסס בינה מלאכותית משלה, Google I/O, ועידת המפתחים השנתית של גוגל, יצאה לדרך עם שורה ארוכה מאוד של הכרזות שקשורות לבינה מלאכותית, שחלקן מציעות פתרונות מעודכנים של החברה כדי לתת מענה לכל תחרות קיימת או אפשרית.

ואחד המעניינים ביותר הוא שילוב של בינה מלאכותית במנוע החיפוש של החברה, שהושק כבר היום, באופן ניסיוני ומוגבל בארצות הברית בלבד בינתיים, תחת השם AI Overviews. בחברה מציינים, שמדובר בגישה מוקדמת, סוג של טעימה בינתיים, לעתיד של מנוע החיפוש של גוגל, שיהיה מבוסס על בינה מלאכותית יוצרת תוכן. עם זאת, לא מדובר בצ'אבוט רגיל שמבוסס על ג'מיני, שמנהלים איתו סוג של שיחה טקסטואלית: מדובר במנוע שיודע להציג תשובות מפורטות ברמה פשוטה ו/או גבוהה יותר לחיפוש מידע, בסידור נוח וברור יותר, כדי לקבל מיד את המידע הרלוונטי – שרק אחד מהאלמנטים הוא רשימת קישורים לאתרים אחרים.

מעבר לכך, אמור מנוע החיפוש החדש של גוגל גם להפוך לכלי תכנוני, וכבר עתה יוכלו משתמשים בארצות הברית להתחיל להשתמש בו כדי לתכנן ארוחות וחופשות באמצעות שאלות כמו, "הרכב לי תפריט לשלושה ימים לקבוצת אנשים עם ארוחות קלות להכנה", כדי לקבל תוכנית בסיסית ישירות לתיבת הדואר על בסיס מתכונים שנמצאים באינטרנט, כשהמנוע בעצם מבצע את החיפוש עבור המשתמש וגם מאפשר לבצע שינויים, כמו החלפת אחת המנות לטבעונית.

בגוגל מספרים, ש-AI Overview יהיה זמין ליותר ממיליארד משתמשים עד סוף 2024, ושהמודל שעומד מאחורי המנוע ישופר כדי לספק מענה גם לשאלות מורכבות, ואפילו לענות לשאלות שקשורות לחפצים שיוצעו למנוע באמצעות צילום סרטון וידיאו עצמאי. החיפוש באמצעות וידיאו יהיה זמין קודם כל למשתמשים באנגלית באמצעות Search Labs.

גם גוגל הולכת להוליווד

כלי מעניין אחר שהציגה גוגל הוא Veo, מודל בינה מלאכותית ליצירת סרטוני וידיאו, שאמור להתעלות על Sora של OpenAI ולאפשר באמצעות טקסטים, ואף דיבור בסופו של דבר, ליצור סרטונים בני כמה דקות בכל סגנון קולנועי שקיים, כולל סרטונים שאמורים להיראות מציאותיים לחלוטין.

ומדוע בגוגל טוענים שהוא יותר טוב? בגלל היכולת שלו להבין באופן מלא שפה טבעית, ולהשתמש בתיאורים פשוטים ואף במונחים שקשורים לעולם הקולנוע עצמו, כולל היכולת להסתמך על תמונות וסרטוני וידיאו קצרים שישולבו בתיאור כדי ליצור סרטון חדש שמבוסס עליהם.

עוד דבר שמבטיחים בגוגל לגבי Veo הוא, שניתן יהיה לערוך את הסרטונים הללו לאחר יצירתם באמצעות הוראות נוספות, מתקנות, כדי לא לחזור שוב על כל התהליך מחדש, וכן מציינים בחברה, שבעתיד הלא מוגדר המודל ישופר כדי להכין במהירות גדולה יותר סרטונים עוד יותר ארוכים.

בדומה למתחרתה, גוגל אינה מתכוונת להפוך את Veo כבר עכשיו לנחלת הציבור. לפי החברה, במהלך השבועות הבאים היא תציג את הכלי בפני קבוצה מצומצמת משהו של יוצרי תוכן, ובראשם במאי קולנועי מובילים – אולי גם כן במסע לאולפני הסרטים שלהם בהוליווד. מי שרוצה יכול לבצע הרשמה מוקדמת לשירות VideoFX שיהיה מבוסס על Veo. שירות זה יציע חלק מהתכונות של המנוע החדש עבור יוצרי תוכן ביו-טיוב, רק שבגוגל ממש לא מתחייבים על המועד בעתיד בו השירות יהיה זמין.

סייען מבוסס בינה מלאכותית

גוגל כבר שילבה יכולות שונות של ג'מיני בסייען הווירטואלי שלה באנדרואיד, אבל הדור הבא, שבינתיים מכונה פרויקט אסטרא (Astra), כבר אמור להיות משהו אחר: הבינה המלאכותית שמאחוריו תוכל להבין את העולם שהיא פועלת בו ולשוחח בהתאם לכך עם המשתמש על ידי שימוש בשפה טבעית – ולא רק באמצעות הטלפון: גוגל הציגה את השימוש באסטרא גם באמצעות משקפיים חכמים, מה שיוכל אולי לגרום לשוק המסוים הזה להיות הרבה יותר רלוונטי.

כך או כך, גוגל הציגה סרטון שבו הטכנולוגיה החדשה שולבה באפליקציה המשתמשת במצלמה כדי לראות את העולם ומאפשרת, כאמור, לשאול שאלות חיפוש שונות. אחת הדוגמאות שהוצגו הייתה "חפש עבורי חפץ שמשמיע קול", ואחרי שבוצע חיפוש סביבתי באמצעות המצלמה, המנוע סימן רמקול כתשובה אפשרית. לפי גוגל, המודל ידע גם להתייחס לחפצים שהוא הבחין בהם בסביבה כמה דקות קודם, לדוגמה, וגם לאירועים שהתרחשו קודם. דוגמה אחת מסוימת שניתנה הייתה השאלה, "איפה הנחתי את המשקפיים שלי?", והיא קיבלה תשובה מדויקת.

גוגל לא סיפקה לוח זמנים לגבי אסטרא, אבל כמו שהיא עושה בהיבטים אחרים, חלק מהיכולות שלו ישולבו קודם בג'מיני, וגם במקרה הזה לא ברור מתי.

ויש עוד

מעבר לכך, הכריזה על גוגל על עוד הרבה מאוד חידושים והמצאות, שכולם סביב הבינה המלאכותית. כך, למשל, Ask Photos – שתאפשר לבצע חיפוש תמונות חכם יותר בשירות אחסון הענן של החברה באמצעות אפליקציית התמונות. התכונה החדשה, שאמורה להשתלב באפליקציה בקיץ הקרוב, תציע גם אפשרות, לדוגמה, לחפש את התמונות המייצגות רגעי שיא מבין קבוצה של תמונות שצולמו באותו טיול, להבין הקשרים ונושאים של תמונות, ואפילו להציג שרשרת של תמונות שמתייחסות לאירוע משתנה – סונדר פיצ’אי, מנכ"ל החברה, הציג על הבמה את הבקשה "תראי לי את ההתקדמות של לוסיה בשיעורי שחייה", שהניבה שורה של תמונות שמתייחסות ליכולות השחייה שלה לאורך השנים.

כן התייחסה גוגל למודל ג'מיני נאנו, שיפעל במכשירים מבוססי אנדרואיד באופן מקומי, כולל שימוש ביכולות רב מודליות, לדוגמה שילוב של תמונה עם צליל. חלק מהיכולות ישולבו לפי גוגל בשירות TalkBack, המיועד לסיוע לאנשים עם ליקויי ראייה לקבל תיאורים מדויקים וברורים יותר של תמונות המוצגות בטלפון, גם בלי חיבור לאינטרנט, ובמהירות רבה.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים