איך נלמד את סירי וקורטנה לזהות סרקזם?

למידת מכונה אינה עניין של מה בכך: העוזרים הווירטואליים כבר מבינים היטב פקודות בסיסיות שלנו, אבל נדרש לעבוד על האופן שבו נהפוך את המחשבים לדקי אבחנה כמונו, או אפילו יותר מאיתנו

Siri. קיצורי הדרך אליה מסכנים משתמשים?

טקסטים ציניים או סרקסטיים עלולים להיות קשים לפענוח גם לבני אדם, לא כל שכן לרובוטים. כלומר, כאשר אתם אומרים "תודה רבה לך, סירי (Siri), רציתי שתתני לי הכוונה לכפר סבא, לא שתתקשרי עכשיו לאבא", הכוונה של הדברים שלכם לעולם לא תובן על ידי ה-"יצורים" המתוחכמים. הבנת סרקזם, כך על פי מדענים, תהווה רכישה של אחת היכולות הגבוהות ביותר של הבינה המלאכותית.

זאת הסיבה לכך שמדענים בונים כעת את מסד הנתונים הגדול ביותר של הסרקזם. קבוצה של סטודנטים למחשבים מפרינסטון אספה הערות סרקסטיות מ-1.4 מיליון משתמשי Reddit, בכדי לשפר את עיבוד השפה הטבעית.

ב-Reddit אנשים מספרים מתי הם סרקסטיים

למה דווקא Reddit נבחר לצורך המטרה החשובה? בעיקר בגלל תוויות ה-s/, שבהן עושים משתמשי האתר לעתים קרובות שימוש בכדי להצביע על סרקזם בהערותיהם.

צוות החוקרים הריץ תוויות s/ באמצעות תוכנית וסינן אותן לפי שמות המחברים ו-Subreddit, שהם תכנים שמאורגנים באתר לפי תחומי העניין השונים. באופן לא מפתיע, ה-Subreddits שהניבו הכי הרבה תגובות סרקסטיות היו זכויות הגבר ופוליטיקה, מה שהבטיח להם ארכיב נפרד במסד הנתונים, שמכיל לא פחות מ-30 אלף תגובות סרקסטיות אקסקלוסיביות לתחום.

בכל אופן, באופן שבו הם פעלו יצרו החוקרים מסד נתונים הגדול פי 10 מאשר כל מסד נתונים קודם בתחום הסרקזם, ומדובר בנתון סופר מרשים. ולא, אני לא כותבת את זה בסרקזם.

OpenAI תקנה כוח מחשוב ממתחרה של אנבידיה ב-10 מיליארד דולר

לא רק איראן: טראמפ הטיל מכס של 25% על "שבבים מסוימים"

"אפל תייצר מעבדי שרתים בעצמה ותפעיל דאטה סנטרים המבוססים עליהם"

מארוול רוכשת את XConn Technologies לחיזוק פתרונות הקישוריות ל-AI

הסייבר המתואם של איראן: האקרים בחסות המדינה + האקטיביסטים

האקתון ייחודי: בני.ות נוער פותרים אתגרים של הממשלה

"מנמ"רים וארגונים שלא יסתכלו על דיפ-טק כבר היום – יישארו מאחור"

"אם ארצות הברית תתקוף – היא תעשה זאת גם בסייבר"

"מנמ"רים וארגונים שלא יסתכלו על דיפ-טק כבר היום – יישארו מאחור"

הבאג החבוי של חברות הצמיחה

נוסחת ה-4 טריליון, או: מה הביא לצמיחה האדירה של גוגל?

זיכרון גורלי – העתיד של סוכני AI

הישראליות ב-CES: בינה בקופסה

המדדים להצלחת יישום ה-AI בארגון

"2026 עתידה להפוך ל-שנת ההתבגרות העסקית של השוק ב-AI"

"כוח-על" – כיפת ברזל ניהולית ל-2026

איך נלמד את סירי וקורטנה לזהות סרקזם?

ב-Reddit אנשים מספרים מתי הם סרקסטיים

תגובות

כתיבת תגובה לבטל

אירועים קרובים

ידיעות מובילות

שירת 650 ימי מילואים – ונאבק להשגת מימון לתרופה להצלת בנו

ממר"ם תקים בשנה הקרובה מפעל AI

מירב חליוה מונתה לסמנכ"לית מערכות מידע בתנובה

הצעדים הקריטיים שכל CFO בישראל חייב לנקוט ב-2026

"2026 תהיה שנת קפיצה בצריכת ענן ובפרויקטי AI בייצור"

לאומי: חטיבת הטכנולוגיות תפוצל – איל אפרת יעמוד בראש החטיבה הבנקאית

OpenAI תקנה כוח מחשוב ממתחרה של אנבידיה ב-10 מיליארד דולר

לא רק איראן: טראמפ הטיל מכס של 25% על "שבבים מסוימים"

"אפל תייצר מעבדי שרתים בעצמה ותפעיל דאטה סנטרים המבוססים עליהם"

מארוול רוכשת את XConn Technologies לחיזוק פתרונות הקישוריות ל-AI

הסייבר המתואם של איראן: האקרים בחסות המדינה + האקטיביסטים

האקתון ייחודי: בני.ות נוער פותרים אתגרים של הממשלה

"מנמ"רים וארגונים שלא יסתכלו על דיפ-טק כבר היום – יישארו מאחור"

"אם ארצות הברית תתקוף – היא תעשה זאת גם בסייבר"

"מנמ"רים וארגונים שלא יסתכלו על דיפ-טק כבר היום – יישארו מאחור"

הבאג החבוי של חברות הצמיחה

נוסחת ה-4 טריליון, או: מה הביא לצמיחה האדירה של גוגל?

זיכרון גורלי – העתיד של סוכני AI

הישראליות ב-CES: בינה בקופסה

המדדים להצלחת יישום ה-AI בארגון

"2026 עתידה להפוך ל-שנת ההתבגרות העסקית של השוק ב-AI"

"כוח-על" – כיפת ברזל ניהולית ל-2026

איך נלמד את סירי וקורטנה לזהות סרקזם?

ב-Reddit אנשים מספרים מתי הם סרקסטיים

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

ידיעות מובילות

שירת 650 ימי מילואים – ונאבק להשגת מימון לתרופה להצלת בנו

ממר"ם תקים בשנה הקרובה מפעל AI

מירב חליוה מונתה לסמנכ"לית מערכות מידע בתנובה

הצעדים הקריטיים שכל CFO בישראל חייב לנקוט ב-2026

"2026 תהיה שנת קפיצה בצריכת ענן ובפרויקטי AI בייצור"

לאומי: חטיבת הטכנולוגיות תפוצל – איל אפרת יעמוד בראש החטיבה הבנקאית