אפל רוצה לאמן את ה-AI שלה על אתרים: רבים מסרבים לה
על פי הדיווחים, ארגוני חדשות גדולים, כולל הניו יורק טיימס, הפייננשל טיימס, פייסבוק, אינסטגרם, USA Today ואחרים לא מוכנים לאפשר לענקית מקופרטינו להכשיר את מודל הבינה המלאכותית שלה על התוכן שבבעלותם
דיווחים חדשים במדיה העולמית מצביעים על כך שאתרי תוכן גדולים רבים ביטלו את הסכמתם להכשרת ואימון ה-AI של אפל על התכנים שלהם. בין האתרים שסירבו לאפל נכללים ארגוני חדשות גדולים בהם הניו יורק טיימס, הפייננשל טיימס; רשתות חברתיות כמו פייסבוק ואינסטגרם של מטא, טאמבלר ואחרות; ואתרים בולטים כמו קרייגסליסט ורשת USA Today. על פי דיווח ב-Wired כל אלו ורבים אחרים ביטלו את האישור להכשרת הכלי של אפל בנכסים הדיגיטליים שלהם. דאגות הגופים הללו, כפי שדווח, הן בנושא ההגנה על התוכן שלהם, והבטחה שלא יעשה בו שימוש ללא פיצוי מתאים או מתן קרדיט ראוי ליוצרי התוכן.
התופעה הציפה שיח מהותי אודות השימוש בתוכן מקוון לצורך פיתוח הבינה המלאכותית, וכן על עתיד הבעלות על תוכן.
Nobody likes when their data is used for AI training
This summer, Apple gave website owners the option to block the use of their data for AI training. Unsurprisingly, many platforms immediately took advantage of this. The New York Times, Facebook, Instagram, Craigslist, Tumblr,… pic.twitter.com/mDlNHlRhhV
— FRKN VPN (@frkn_vpn) August 30, 2024
אפל אפשרה לא להשתתף – רבים קפצו על העגלה
הסירוב המדווח מגיע לאחר ש-אפל הציגה כלי אימון בינה מלאכותית חדש וייחודי בשם Applebot-Extended, ובכך אפשרה לבעלי אתרים לא לכלול את הנתונים שלהם בהכשרת מודלי ה-AI שלה. Applebot המקורי, שהוכרז ב-2015, סרק בתחילה את האינטרנט כדי להפעיל מוצרי אפל כמו סירי (Siri) ו-Spotlight. עם זאת, לאחרונה, המטרה של ה-Applebot התרחבה והחברה החליטה להשתמש בנתונים שהוא אוסף גם כדי להכשיר את המודלים הבסיסיים שיצרה עבור מאמצי הבינה המלאכותית שלה. הכלי החדש Applebot-Extended, הוא למעשה הרחבה לבוט סריקת האינטרנט של אפל, שתוכננה במיוחד כך שתאפשר לאתרים לומר ל-אפל לא להשתמש בנתוניהם.
אפל פרסמה ביוני פוסט בבלוג שלה, המסביר כיצד הכלי עובד. לדבריה, "בנוסף לשמירה על כל הכללים וההנחיות של robots.txt, לאפל יש סוכן משתמש משני, Applebot-Extended, המעניק לבעלי אתרים שליטה נוספת על האופן שבו תוכן האתר שלהם יכול לשמש אותה. עם Applebot-Extended, בעלי אתרים יכולים לבחור לבטל את הסכמתם לכך שתוכן האתר שלהם ישמש כדי להכשיר את דגמי היסוד של אפל, המספקים תכונות בינה מלאכותית יוצרת במוצרי אפל, כולל Apple Intelligence, Services וכלי מפתחים".
החברה ציינה עם זאת כי איפשור פעולת Applebot-Extended "יעזור לשפר את היכולות והאיכות של דגמי הבינה המלאכותית של אפל לאורך זמן". לצערה של אפל בינתיים מסתמן שהחברות לא השתכנעו מנימוק זה.
יצוין כי ה-Applebot-Extended למעשה לא מונע מה-Applebot המקורי לסרוק את האתר – מה שישפיע על האופן שבו התוכן של האתר המסוים יופיע במוצרי החיפוש של אפל – אלא מוֹנע את השימוש בנתונים האלה כדי להכשיר את דגמי השפה הגדולים של אפל, ופרויקטים אחרים של AI.
האם אפל ניסתה להמנע מתביעות זכויות יוצרים נגד OpenAI ואנתרופיק?
דוברת אפל, נאדין הייג'ה, הסבירה כי ה-Applebot-Extended היה על תקן הדרך של ענקית הטק לכבד את זכויות האתרים. אפשר שהכלי הגיע גם לנוכח ניסיונן של חברות הבינה המלאכותית המובילות, כדוגמת OpenAI ומאוחר יותר אנתרופיק (Anthropic), שספגו כבר תביעות זכויות יוצרים משמעותיות – למשל מהניו יורק טיימס ומהשחקנית והסופרת שרה סילברמן – בדיוק בגלל אימוני הכלים ומודלי ה-GenAI שלהן על תכנים לא מורשים.
על אף ש-אפל הציגה את הכלי כדרך לספק לבעלי אתרים שליטה על הנתונים שלהם, אתרים רבים טוענים כי מתן אפשרות לאפל להשתמש בתוכן שלהם לצורך אימון הבינה המלאכותית עלול לפגוע בערך הקניין הרוחני שלהם ולשחוק את השליטה שלהם על אופן השימוש בתוכן שהם ייצרו.
אפל הגיבה לסירוב של האתרים בהגנה על Applebot-Extended שלה, והצהירה שהיא שומרת על זכויות המפרסמים ולכן הציעה ביטול קל לתהליך איסוף המידע, אם אינו רצוי.
בנוסף, כפי שכבר הסברנו, דובר אפל הבהיר שהכלי רק עוצר את השימוש בנתונים באימון AI, ולא את הסריקה המקורית של האתר.
עם זאת, ניכר כי החששות של ארגוני מדיה ואתרים אחרים בנוגע לאופן שבו חברות טכנולוגיה משתמשות בתוכן שלהם נמשכים, בנוסף משום הדאגה כי מודלי ה-AI שיאומנו על התוכן יוכלו בקרוב ליצור לבדם תוכן הדומה מאוד לעבודה המקורית של כותבי ויוצרי התכנים בני האנוש.
תגובות
(0)