האם גוגל תוכל לנצח את ChatGPT עם מחולל המוזיקה החכם MusicLM?
כלי ה-AI שהציגה הענקית באחרונה מלחין מוזיקה מתיאור טקסטואלי, והתוצאה - מרשימה ● החברה אומרת שמודל ה-MusicLM AI שלה הוא מחולל הטקסט-מוזיקה הטוב ביותר עד כה, אבל לעת עתה הוא לא זמין בעבורנו, מדוע?
גוגל הודיעה באחרונה על חידוש שמעניק משמעות חדשה למושג "כתיבת מוזיקה" – MusicLM שמו. מדובר למעשה במערכת בינה מלאכותית היודעת לחולל מוזיקה על פי תיאור טקסטואלי שלה בלבד.
ה-MusicLM – מערכת הבינה המלאכותית העדכנית ביותר של גוגל – יכול להלחין ולייצר מוזיקה על בסיס תיאור והוראות כתובות, אלא שמודלים שמייצרים מוזיקה על סמך טקסט, המופעלים על ידי בינה מלאכותית, אינם עניין חדש. ואולם גוגל טוענת ש-MusicLM שלה מתעלה על מערכות קודמות, הן באיכות השמע והן בנאמנות התוצאה לתיאור המילולי, כך לפי TechCrunch.
חוקרי הענקית ממאונטיין וויו העלו אל Google Research ב-GitHub מספר דוגמאות ליכולות החדשניות של הכלי, וציינו: "אנו מציגים את MusicLM, מודל המייצר מוזיקת בנאמנות גבוהה מתיאורי טקסט כגון 'מנגינה של כינור מרגיעה מגובה בריף גיטרה מעוות'. MusicLM מתייחס לתהליך של יצירת מוזיקה כאל משימת מודלים היררכית של רצף לרצף, ומייצר מוזיקה ב-24 קילו-הרץ, שנשארת עקבית לאורך מספר דקות. הניסויים שלנו מראים כי MusicLM מתעלה על מערכות קודמות, הן באיכות השמע והן בעמידה בתיאור הטקסט". החוקרים הבהירו עוד כי בנוסף ליכולת ליצור מוזיקת ב"נאמנות גבוהה" מטקסט, ניתן גם להדריך את ה-AI על ידי זמזום או שריקה של מנגינה, ואף לשלב בין שתי הגישות, ולפתח כל מיני אפשרויות יצירתיות אישיות.
אחרי ההסבר הזה הוצגו היכולות המרשימות, בהבהרה כי "כדי לתמוך במחקר עתידי, אנו משחררים בפומבי את MusicCaps, מערך נתונים המורכב מ-5.5 אלף צמדי מוזיקה-טקסט, עם תיאורי טקסט עשירים שסופקו על ידי מומחים אנושיים". חוקרי גוגל פרסמו עשרות קטעי אודיו, לצד הטקסט ששימש לתיאורם וליצירתם. מסתבר כי ה-MusicLM הוכשר על מערך נתונים מ-280,000 שעות מוזיקה, כדי ללמד אותו ליצור טראקים קוהרנטיים, כך על פי מאמר אקדמי המפרט את יכולות הבינה המלאכותית החדשה של גוגל.
MusicLM: Generating Music From Text
abs: https://t.co/fQJHh2OjOK
project page: https://t.co/Nb0WpC6oNe pic.twitter.com/7RN7MQx8Ex— AK (@_akhaliq) January 27, 2023
האם מחולל המוזיקה יספיק כדי לא להפסיד למיקרוסופט?
הכלי של גוגל פועל בדומה ל-ChatGPT, המשתמש בבינה מלאכותית כדי ליצור סיפורים, שירים, חיבורים, סלוגנים, פוסטים, לכתוב קוד ובכלל – להנפיק כל מיני קטעי כתיבה מסוגות שונות בתוך שניות בודדות. ההתלהבות מהכלי רבה, אבל במקביל הוא גם מרתיע רבים בגלל הפוטנציאל שלו להיות משנה-משחק הן בתחום הלימודים והאקדמיה, הן בזירות כמו עיתונות ותקשורת, והן בכל הקשור בחיפוש אינטרנטי, עניין שגם אותו הוא יודע לבצע ובהצלחה מרובה.
מיקרוסופט, מתחרה בולטת של גוגל, הצליחה להקדים את ענקית החיפוש ובישרה בדיוק לפני שבוע בפוסט שעלה בבלוג שלה, על השקעת ענק ב-OpenAI, החברה האם של ChatGPT. הסכום המדויק שענקית התוכנה השקיעה לא פורסם, אך מוערך בכ-10 מיליארד דולר.
השותפות ההדוקה הזו, כך לפי אנליסטים, עשויה לספק למיקרוסופט יתרון עצום על פני גוגל בתחום החיפוש, שכן ChatGPT ישולב לתוך מנוע החיפוש שלה בינג (Bing). כמו כן החידושים איפשרו כבר לחברה להציע ללקוחותיה את שירות Azure OpenAI של מיקרוסופט, שהושק ב-17 בינואר הנוכחי. שירות חדשני זה עתיד לאפשר למפתחים לבנות יישומי AI מתקדמים, באמצעות גישה ישירה למודלים של OpenAI, המגובים ביכולות Azure ברמה ארגונית ובתשתית וכלים מותאמים לבינה מלאכותית.
אם נחזור לגוגל – המוזיקה, שניתן להאזין לה בצמוד לתיאורה, כאמור, מרשימה ממש, גם אם להתרשמות זו נלווה חשש גדול מטעם מי שטוענים של-AI יש פוטנציאל להרוס את היצירתיות האנושית. הדאגה היא שאם עד כה האיום מטעם פיתוחי הענק של OpenAI – ה-DALL•E2 ו-ChatGPT – היה בתחומי התוכן הכתוב והמאויר-מצויר, כעת הוא מגיע בנוסף אל הזירה המוזיקלית וישבש גם אותה.
עם זאת, ולא ברור האם מדובר בבשורה טובה אם לאו – בינתיים הגולשים אינם יכולים לנסות את MusicLM בעצמם, משום שסוגיות אתיות עוצרות את שחרורו לציבור. מה שחוסם את גוגל במקרה זה הוא אותן דאגות לגבי השפעתו הפוטנציאלית של כלי ה-AI החדש המסוים על תעשיית המוזיקה העולמית, שהיקפה 35 מיליארד דולר – בין השאר על סוגיית זכויות היוצרים. על פי הדיווחים השונים בתקשורת העולמית, עד ש-גוגל תפצח את העניינים הללו, האתיים ביסודם, אין לחברה תוכניות להפיץ את הטכנולוגיה לשימוש הציבור הרחב.
עם זאת, כאמור, צוות הפיתוח של גוגל פרסם את עבודת המחקר ומערך הנתונים שלו, הכולל 5,500 צמדי מוסיקה-טקסט, מהם ניתן לקבל תובנות נוספות על היכולות החדשות, כך שאפשר פשוט להתחיל בהתעמקות באלו, בינתיים.
תגובות
(0)