אפל, אנתרופיק ועוד חברות השתמשו בסרטוני יו-טיוב לאימון ה-AI שלהן
יו-טיוב טוענת ששימוש בתוכן של יוצרים כדי לאמן מערכות בינה מלאכותית יפר את תנאי השירות שלה – כיצד היא תגיב כעת לידיעה על החברות שהשתמשו בתכנים שלה?
יותר מ-170,000 סרטוני יו-טיוב היוו חלק מאוסף נתונים עצום ששימש לאימון מערכות בינה מלאכותית עבור כמה מחברות הטכנולוגיה הגדולות ביותר, לפי תחקיר של Proof News שפורסם במשותף עם אתר Wired. אפל, אנתרופיק, אנבידיה וסיילספורס הן בין חברות הטכנולוגיה שהשתמשו בנתוני "כתוביות יו-טיוב" (YouTube Subtitles), שנלקחו מפלטפורמת הווידיאו ללא היתר. מערך נתוני האימון הוא אוסף של כתוביות שנלקחו מסרטוני יו-טיוב השייכים ליותר מ-48,000 ערוצים, והוא אינו כולל תמונות מהסרטונים.
סרטונים של יוצרים פופולריים כמו מיסטר ביסט (MrBeast) ומארק בראונלי מופיעים במערך הנתונים, כמו גם קליפים מערוצי חדשות כמו ABC News, BBC ו-הניו יורק טיימס. יותר מ-100 סרטונים מ-The Verge מופיעים במערך הנתונים, יחד עם סרטונים רבים אחרים מ-Vox.
"אפל אספה נתונים עבור ה-AI שלה מכמה חברות. אחד מהם גירד טונות של נתונים/תמלילים מסרטוני יו-טיוב, כולל שלי", כתב בראונלי בפוסט ב-X, והוסיף: "זו הולכת להיות בעיה מתפתחת במשך זמן רב".
כחלק מהתחקיר שלה, Proof News גם פרסמה כלי חיפוש אינטראקטיבי, שמאפשר להשתמש בתכונת החיפוש שלו כדי אילו ושל מי מופיעים במערך הנתונים.
מערך הכתוביות הוא חלק מאוסף גדול יותר של חומר מעמותת EleutherAI בשם The Pile, שהוא אוסף קוד פתוח המכיל גם מערכי נתונים של ספרים, מאמרים בוויקיפדיה ועוד. בשנה שעברה, ניתוח של מערך נתונים אחד בשם Books3 חשף אילו עבודות של מחברים שימשו לאימון מערכות בינה מלאכותית, ומערך הנתונים צוטט בתביעות של מחברים נגד החברות שהשתמשו בו לאימון בינה מלאכותית.
חברות בינה מלאכותית לרוב לא שקופות בנוגע לנתונים המשמשים אותן למערכות ה-AI שלהן. בחודשים האחרונים נידונה השאלה כיצד נעשה שימוש ספציפי בתוכן של יו-טיוב. בחודש מרץ האחרון, כאשר OpenAI חשפה את Sora – הכלי שיוצר וידיאו, התחמקה מנהלת הטכנולוגיות של החברה, מירה מוראטי, שוב ושוב משאלות האם המערכת משתמשת לצורך אימון בסרטוני יו-טיוב.
"אני לא הולכת להיכנס לפרטי הנתונים שבהם נעשה שימוש, אבל הם היו נתונים זמינים לציבור או ברישיון", אמרה אז לוול סטריט ג'ורנל. כשנשאלה על יו-טיוב במיוחד, מוראטי אמרה שהיא "לא בטוחה לגבי זה".
יו-טיוב לא הגיבה לפרסום.
תגובות
(0)