העוזר הקולי של גוגל שוב התגלה כחכם יותר מאלקסה וסירי
בבדיקת הבנת הפקודות והפניות הקוליות שהעוזרים והעוזרות מקבלים ממשתמשי הטלפונים הניידים התגלה כי ביצועי העוזרות הקוליות של אפל ושל אמזון נחותים לעומת ביצועיו של ה-Google Assistant, כך מצאה חברת המחקר לופ ונצ'רס
Google Assistant – העוזר החכם מבוסס הבינה המלאכותית של גוגל – ממשיך לגבור על יריבותיו, סירי של אפל ואלקסה של אמזון במבחני העוזרים הקוליים, כך לפי מחקר של חברת ההון סיכון לופ ונצ'רס.
בניסוי שערכו זו השנה השלישית, הציגו החוקרים בפני העוזרים הקוליים המובילים 800 שאלות, שכל אחת מהן נועדה לנסות ולאמוד את מידת הדיוק של הבנת הדיבור והכוונה מטעם העוזרים.
"כחלק מהמאמץ המתמשך שלנו להבנה טובה יותר של מקרי השימוש המעשיים של AI והופעת הקול כקלט מחשוב, אנו בודקים באופן קבוע את העוזרים הדיגיטליים הנפוצים ביותר ואת הרמקולים החכמים", צוטט שותף-מייסד ומנהל החברה, ג'ין מונסטר, בדו"ח שתוצאותיו פורסמו ביום ה' האחרון. "הפעם התמקדנו בעוזרים דיגיטליים מבוססי סמארטפון", הוא הבהיר.
במבחן בקיץ הקודם, ה-Smart Speaker IQ Test של 2018, שנערך על ידי חברת הון-הסיכון Loup Ventures ממינסוטה, הגיע Google Assistant, שנבדק על הרמקול החכם Google Home, להישג מרשים: הוא הצליח לענות נכון על 86% מהשאלות. במבחן המקביל ב-2017 השיג העוזר תוצאה של 81.1% "בלבד". ומה קרה הפעם?
היי אלקסה, תשתפרי
כאמור, במחקר האחרון התייחסה החברה לעוזרים והעוזרות הקוליים שפועלים על מכשירים ניידים, ומצאה כי Google Assistant הצליח בהרבה, לעומת סירי, ושזו גברה על אלקסה, שהשיגה תוצאה מאכזבת, יחסית.
במבחן ביולי 2018 השיגה סירי תוצאה של 79% ואלקסה הסתפקה בהישג הנחות של 61%, ואילו במחקר ביניים, שתוצאותיו פורסמו בדצמבר האחרון, ובו בדקה לופ ונצ'רס רמקולים חכמים, נמצאו תוצאות דומות. מבחן זה הראה כי Google Assistant הצליח לענות נכון על 88% מהשאלות לעומת סירי עם 75% תשובות נכונות ואלכסה עם 73%.
800 השאלות חולקו לחמש קטגוריות: מקומית ("איפה בית הקפה הקרוב ביותר?"), מסחרית ("הזמיני לי עוד ממוצר X"), ניווט ("איך מגיעים ל-X באוטובוס?"), מידעית ( "איפה משחקת קבוצת X הלילה?"), ופקודות ("תזכיר לי להתקשר ל-X בשעה X").
"העוזר של גוגל היה שוב עם הביצוע הטוב ביותר, הוא ענה נכון ב-93% מהמקרים והבין נכון את כל 800 השאלות," פירטה לופ. "סירי הייתה הבאה, היא ענתה נכון ל -83% מהמקרים והבינה לא נכון רק שתי שאלות; אלכסה ענתה נכון 80% מהפעמים ולא הבינה רק שאלה אחת", הרחיבו החוקרים.
"רבות מאותן מגמות ממשיכות: גוגל מציגה ביצועים טובים יותר בשאלות הקשורות למידע, סירי מטפלת בפקודות בצורה הטובה ביותר, ואילו דירוג השירות המבוסס על מספר השאלות שנענות נותר זהה. אבל היו שיפורים דרמטיים בכל הפלטפורמות ובכל הקטגוריות בשנים הקצרות והמעטות שבהן אנו עוקבים אחר התקדמותם של העוזרים הדיגיטליים", כך סיכמה החברה את הממצאים בפוסט בבלוג שלה.
האם תיפסק הלמידה עכשיו כשההקלטות ניתנות לביטול?
עם זאת, מהתוצאות ניכר שלמרות שאלקסה, שפועלת ברמקולים החכמים של אמזון, היא הנמכרת והפופולרית ביותר בתחום זה, יש לחוקרי אמזון עדיין דרך לעשות כדי להפוך אותה לחכמה יותר.
באחרונה חשפו פרסומים במדיה נוהל של כל החברות להקליט את המשתמשים, ואז לתמלל את התוכן לצורך אימון הבינה המלאכותית.
אחרי תחקיר של הסאן הבריטי שמצא שחלק מההקלטות שביצעה אלקסה, שפועלת לרוב בבתים פרטיים, תיעדו מצבים אינטימיים בין זוגות בריטים, בישרה אמזון כי עקב הטרוניה שהקימו המשתמשים וכלי התקשורת בנוגע לחדירה הזו לפרטיותם, כעת יוכלו המשתמשים לבטל את התכונה במכשיריהם. האם משמעות הדבר שאלקסה אף פעם לא תדע יותר? ימים יגידו.
תגובות
(0)