מטא שחררה מודלי AI חדשים בקוד פתוח
בין המודלים נכלל גם מודל ליצירת מוזיקה, שפותח על ידי חוקרים ישראלים ● המודלים בקוד הפתוח מיועדים, לפי הענקית ממנלו פארק, לשימוש הקהילה המחקרית
מטא שחררה מספר מודלי בינה מלאכותית בקוד פתוח, שמיועדים, לדבריה, לשימוש של הקהילה המחקרית. המודלים הללו הם פרי מאמץ פיתוחי של צוותי ה-FAIR (ר"ת The Fundamental AI Research) של החברה – קבוצה שהוקמה באופן פנימי כדי לחקור עוד יותר לעומק תחומים קיימים ולפרוץ דרך לתחומים חדשים בשוק הבינה המלאכותית.
Today is a good day for open science.
As part of our continued commitment to the growth and development of an open ecosystem, today at Meta FAIR we’re announcing four new publicly available AI models and additional research artifacts to inspire innovation in the community and… pic.twitter.com/8PVczc0tNV
— AI at Meta (@AIatMeta) June 18, 2024
אחד הדברים אליהם מתייחסת קבוצת המחקר של מטא הוא שינוי הכיוון של מודלי השפה הגדולים. כך למשל, מחיזוי של המילה הבאה בלבד – יכולת שהיא אולי פשוטה יחסית אבל אינה יעילה – המודל יכול לבצע את חיזוי המילה הבאה על ידי שימוש בכמה אסימונים בו-זמנית, כך שניתן יהיה לחזות יותר מאשר רק מילה אחת בכל פעם. התכונה הזו אמורה לשפר את יעילות החיזוי, את הדיוק וגם את המהירות של המודל. המודלים שקשורים לכך מוצעים כעת ברישיון לא מסחרי ולמחקר בלבד.
As part of our releases this week, Meta FAIR introduced JASCO. This model differs from other text-to-music approaches with improved controllability using conditioning inputs like chords or beat.
Details and samples ➡️ https://t.co/zsk7nkTPbv pic.twitter.com/8R8XO0dLwM
— AI at Meta (@AIatMeta) June 20, 2024
מודל JASCO – ליצירת מוזיקה; AudioSeal – להגנה משימוש לרעה במודלים
כן הציגה החברה את המודל JASCO שהוא מודל ליצירת מוזיקה, שפותח על ידי חוקרים ישראלים, שמועל בדרך מעבר לקבלת פקודות טקסט. המודל יכול לקבל כמידע גם קטעי אודיו קיימים, בשילוב עם הנחיות מדויקות ומדוקדקות יותר שמתייחסות לכלי נגינה, לסגנונות, לאקורדים ואפילו לביטים בודדים. בעמוד הדוגמאות של המודל, שישוחרר בהמשך יחד עם קוד המקור שלו, מציג הצוות שיצר את המודל דוגמה לעיבוד של ריתם אנד בלוז ל'אגם הברבורים', וכן גרסת ג'אז לפתיחה של האופרה כרמן של ביזה.
AudioSeal הוא כלי GenAI שמספק טכניקה לסימון דיבור וקולות שנוצרו בידי בינה מלאכותית, והוא גם מאפשר לזהות קטעים שנוצרו בידי ה-AI בתוך קטע אודיו ארוך יותר. לפי מטא, זהו כלי שמטרתו למנוע שימוש לרעה בבינה המלאכותית.
מטא הציגה גם משפחה של מודלים בשם Chameleon שיכולים לשלב בפלט וגם בקלט טקסטים ותמונה יחד על ידי שימוש באסימונים מאוחדים של טקסט ותמונות, ולפי החברה האפשרויות הן אינסופיות כמעט – כולל יצירת תמונה עם כיתוב באופן מיידי ועוד.
הרכיבים המרכזיים ששוחררו הם המודלים Chameleon 7B ו-B34, ברישיון מחקרי בלבד. הדגמים הללו נוקטים בגישה בטוחה במיוחד ותומכים בקלט מעורב, ובפלט טקסטואלי בלבד, ולצורך מטרות מחקריות – ולכן בשלב הזה החברה אינה משחררת את דגם יצירת התמונות של Chameleon.
תגובות
(0)