OpenAI השיקה את Sora: בינה מלאכותית יוצרת שמחוללת וידיאו
הכלי החדש שהוכרז אתמול (ג') כבר גורם לסערה והחברה עצרה זמנית את ההרשמה לשירות, בשל הביקוש העצום לו ● מהן היכולות המדהימות של Sora, ואילו חששות הוא מציף? וגם: מה עוד צפוי בחגיגת ההכרזות של OpenAI?
ביום השלישי מתוך 12 ימי ההכרזות המיוחדים שלה, חשפה חברת OpenAI את כלי הבינה המלאכותית היוצרת המצופה מאוד שלה Sora – מודל AI שנועד ליצירת וידיאו באמצעות תיאור מילולי בלבד.
ההרשמה ל-Sora נפתחה באופן רשמי ומיידית בארצות הברית תחילה – אולם, בגלל שההכרזה התקבלה בהתלהבות רבה, הביקוש הגואה לשירות החדש הביא לעומסים כבדים על שרתי החברה, מה שאילץ את OpenAI להשהות את הרישום. בהודעה שפורסמה באתר Sora.com נכתב: "אנו חווים כעת תנועה כבדה ונאלצנו להשבית זמנית את האפשרות ליצירת חשבונות חדשים".
הכלי הספציפי והמאוד נחשק של החברה הוכרז בסרטון שהעלתה החברה לערוץ היוטיוב שלה, ובו השתתפו סם אלטמן, המנכ"ל; אדיטיה רמש, ראש תחום DALL·E; ביל פיבלס, מדען מחקר; רוהן סחי, מהנדס בכיר; וג'ואי פלין, מעצב מוצר בכיר, כולם מ-OpenAI.
בהמשך פרסמה החברה ביוטיוב מספר סרטוני הדרכה על האופן שבו עובדים עם מחולל הווידיאו החדש שלה.
Sora מצטרף למשפחת כלי הבינה המלאכותית היוצרת של OpenAI, חברה שנוסדה ב-2015 וידועה בפיתוח מודלים גדולים של שפה (LLMs) ובניית כלים מתקדמים וחדשניים בתחום ה-GenAI. כלי הדגל של החברה, ChatGPT, שהושק בסוף 2022, חולל מהפכה של ממש בתחום וגם סביבו חלה היסטריה כשהושק וצבר למעלה מ-300 מיליון משתמשים בתוך שבועיים.
מה עושה Sora?
Sora מאפשר למשתמשים בו ליצור סרטונים באיכות גבוהה, באורך של עד 20 שניות וברזולוציה של עד 1080p, באמצעות הנחיות טקסט פשוטות. בנוסף ליכולת ליצור סרטונים מאפס, ניתן גם להעלות מדיה אישית ולהשתמש בה כדי להרחיב, לערוך ולמזג תכנים קיימים ביצירה החדשה.
בין היכולות המרשימות של Sora: יצירת וידיאו ריאליסטי – סורה מסוגל ליצור וידיאו שנראה אמין ומציאותי, עם פרטים מורכבים ומרשימים; אנימציה של תמונות – ניתן להזין תמונה סטטית אל המודל, ולתת לו הנחיות טקסט כיצד להנפיש אותה; עריכת וידיאו בסגנונות שונים: ניתן להשתמש בסורה כדי לשנות את הסגנון של סרטונים קיימים, למשל להפוך אותם לסרטים אפלים בסגנון נואר או לסרטוני אנימציה בסגנון סטופ-מושן; שילוב קטעי וידיאו – כלי ה-Storyboard החדש של Sora מאפשר לחבר מספר סרטונים שנוצרו בנפרד לציר זמן אחד, בדומה למה שיודעים לעשות עורכי וידיאו מקצועיים.
מבחינה טכנית, Sora מבוסס על טכנולוגית דיפוזיה, המבטיחה עקביות בין הפריימים על ידי ניתוח בו-זמני של פריימים מרובים. המודל משלב ארכיטקטורת Transformer וטכניקות ממודל Dall-E 3 של OpenAI, מה שתורם ליכולותיו המתקדמות ביצירת וידיאו.
כדי לקבל גישה ולהשתמש ב-Sora, נדרש מנוי ל-ChatGPT Plus בעלות של 20 דולר לחודש, או ל-ChatGPT Pro בעלות של 200 דולר לחודש. מנוי Plus מאפשר יצירת סרטונים באורך של עד 5 שניות וברזולוציה של עד 720p, עם מגבלת יצירה של 50 סרטונים פר-חודש. מנוי Pro מציע יכולות מתקדמות יותר, הכוללות סרטונים באורך של עד 20 שניות וברזולוציה של עד 1080p, יצירת חמש וריאציות שונות של סרטון מהנחייה אחת, ובמקרה של מסלול זה חלה מגבלת יצירה רק של 500 סרטונים בחודש.
Sora – מקור חדש להתלהבות אבל גם לחששות
ההשקה של Sora מציפה שוב חששות בנוגע לשימוש לרעה בטכנולוגיה, ובמקרה הספציפי של מחולל הווידיאו – חשש מסרטוני דיפ-פייק מזיקים. OpenAI אמרה כי היא מודעת לסכנות אלו, והבטיחה כי נקטה במספר צעדי זהירות, ביניהם הוספת סימן מים לכל סרטון שנוצר באמצעות Sora והגבלת העלאת סרטונים עם דמויות אנושיות. החברה אף הקימה צוות פנימי שאמון על זיהוי תכנים בעייתיים שנוצרו באמצעות Sora, ומתחייבת לדווח לרשויות על כל תוכן שיזוהה שיש בו ניצול מיני של ילדים.
"אנו משיקים את טכנולוגיית יצירת הווידאו שלנו כעת, כדי לתת לחברה זמן לחקור את האפשרויות שלה ולפתח במשותף נורמות ואמצעי הגנה שיבטיחו שהיא תנוצל באופן אחראי", הצהירה OpenAI.
בנוסף להכרזה על Sora, מפתחת ה-GenAI הדומיננטית עתידה לחשוף בימים הקרובים עוד שלל חידושים נוספים בתחום. בין היתר, צפויה השקה רשמית של מודל o1, המתמקד בפתרון בעיות מורכבות בתחומי המדע, הקידוד והמתמטיקה, וכן עדכונים ותכונות חדשות ל-ChatGPT ול-Dall-E.
ההשקה של Sora – אולי ההכרזה הכי מצופה וגדולה בסבב הנוכחי – היא צעד משמעותי נוסף בדרך להפיכת ה-GenAI לטכנולוגיה נגישה ושימושית לכלל הציבור. עם זאת, חשוב שגם כמשתמשים נזכור את האחריות שנדרשת מאיתנו בשימוש בטכנולוגיה רבת העוצמה הזו, כדי שלא תנוצל לרעת כולנו.
תגובות
(0)