OpenAI החלה להפיץ את מצב הקול המתקדם של ChatGPT

מדובר כרגע בפיילוט עם קבוצה קטנה של משתמשים משלמים של ChatGPT Plus, ולדברי החברה, התכונה, המספקת קול היפר ריאליסטי, תופץ בהדרגה לכל משתמשי פלוס בסתיו 2024

מדגימה את תכונת הקול המתקדם של במאי האחרון. "צעד לקראת אינטראקציית אדם-מחשב טבעית יותר".

OpenAI החלה אתמול (ג') להפיץ את מצב הקול המתקדם של ChatGPT, המאפשר למשתמשים גישה ראשונה לתגובות האודיו ההיפר-ריאליסטיות של GPT-4o. גירסת האלפא זמינה לקבוצה קטנה של משתמשים משלמים של ChatGPT Plus, ולדברי החברה, התכונה תופץ בהדרגה לכל משתמשי פלוס בסתיו 2024.

כאשר OpenAI הדגימה לראשונה את הקול של GPT-4o בחודש מאי האחרון, התכונה הדהימה את הקהל בתגובותיה המהירות  ובמיוחד בשל הדמיון של קולה של "סקיי" לזה של סקרלט ג'ונסון, השחקנית שמאחורי העוזרת הקולית בסרט "היא". זמן קצר לאחר ההדגמה של OpenAI, ג'ונסון אמרה שהיא סירבה למספר פניות מהמנכ"ל, סם אלטמן, להשתמש בקולה, ולאחר שראתה את ההדגמה של GPT-4o שכרה יועץ משפטי כדי להגן על זכויותיה. OpenAI הכחישה את השימוש בקולה של ג'ונסון, אך מאוחר יותר הסירה את הקול שהוצג בהדגמה שלה, וביוני הודיעה, כי היא תדחה את שחרורו של מצב קול מתקדם כדי לשפר את אמצעי הבטיחות שלה.

כעת אומרת OpenAI, כי יכולות הווידאו ושיתוף המסך שהוצגו באביב לא יהיו חלק מגירסת האלפא הנוכחית, והן יושקו ב"מועד מאוחר יותר". לעת עתה, ההדגמה של GPT-4o שהפתיעה את כולם היא עדיין רק הדגמה, אך, כאמור, לחלק ממשתמשי הפרימיום תהיה כעת גישה לתכונת הקול של ChatGPT המוצגת שם.

לדברי OpenAI מצב הקול המתקדם של GPT-4o שונה מהקול של ChatGPT בגירסה הישנה בכך שהוא הוא מולטי-מודאלי, שמסוגל לעבד משימות ללא עזרת מודלים נלווים, ויכול להביע אינטונציות רגשיות, כולל עצב, התרגשות או שירה.

בפיילוט זה, משתמשי ChatGPT Plus יזכו לחוות ממקור ראשון עד כמה מצב הקול המתקדם של OpenAI הוא היפר-מציאותי באמת.

OpenAI מציינת גם, כי היא משחררת את הקול החדש של ChatGPT בהדרגה כדי לפקח מקרוב על השימוש בו. משתמשים בקבוצת האלפא יקבלו התראה באפליקציית ChatGPT, ולאחריה הודעת אימייל עם הוראות כיצד להשתמש בתכונה.

לדברי החברה, בחודשים שחלפו מאז ההדגמה היא בדקה את יכולות הקול של GPT-4o עם יותר מ-100 צוותים חיצוניים, הדוברים 45 שפות שונות.

מצב קול מתקדם יהיה מוגבל לארבעת קולות מוגדרים, שנעשו בשיתוף פעולה עם שחקני קול בתשלום. דוברת החברה אף ציינה, כי "ChatGPT לא יכול להתחזות לקולות של אנשים אחרים, הן ליחידים והן לאישים ציבוריים, ויחסום פלטים ששונים מהקולות המוגדרים מראש" – זאת, במטרה להימנע מזיופים לא חוקיים. החברה אף הציגה מסננים חדשים כדי לחסום בקשות מסוימות ליצור מוזיקה או אודיו אחר המוגן בזכויות יוצרים.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים