פרופסור עמי מויאל, מכללת אפקה: מאז השקת סירי, תחום זיהוי הדיבור צבר תאוצה

"הצפי הוא שסירי תשפיע לא רק על שוק הטלפונים הניידים, אלא תחדיר את זיהוי הדיבור גם לענפים אחרים", אמר פרופסור מויאל - ראש המחלקה להנדסת חשמל ואלקטרוניקה וראש המרכז לעיבוד שפה במכללת אפקה, לקראת הכנס השלישי לזיהוי דיבור, שיערך ב-20 ביוני ● לדבריו, "כאשר הייתי בתעשייה, הרגשתי כי חסר לנו קשר עם האקדמיה"

תחום זיהוי דיבור בידי מחשב התפתח לאורך השנים בקצב די איטי, וחדר לסגמנטים שונים, אולם לא למגזר הכללי. הדבר הזה השתנה בשנה האחרונה מאז השיקה אפל (Apple) את העוזרת האישית סירי (Siri), ואילו גוגל (Google) הכריזה על Voice Search. דוגמה טובה להתפתחויות המתרחשות בתחום בחודשים האחרונים נוכל לקבל בכנס השלישי לעיבוד דיבור, שיתקיים ב-20 ביוני במכללת אפקה, בהשתתפות מומחים מהתעשייה ומהאקדמיה הישראלית, וכן של אורחים מחו"ל.

פרופסור עמי מויאל, ראש המחלקה להנדסת חשמל וראש המרכז לעיבוד שפה במכללת אפקה, אמר כי הצפי הוא שסירי תשפיע לא רק על שוק הטלפונים הניידים, אלא תחדיר את זיהוי הדיבור גם לענפים אחרים. כך, למשל, הודיעה אפל על  כוונתה להיכנס לשוק ההפעלה הקולית של כלי רכב. "לא מדובר רק על זיהוי פקודות קוליות. בקטגוריה של זיהוי דיבור נכללים גם ניתוח דיבור לשוק הביטחוני, זיהוי דובר, שימושים של עיבוד דיבור לתחום הרפואי, מערכות ניתוב שיחות בארגונים ועוד", אמר מויאל.

לדבריו, אחד המושבים המעניינים יעסוק בהצגת מוצרים שהוטמעו אצל לקוחות אמיתיים, ואילו עתה התעשייה תיתן משוב על כך, תוך כדי שהיא תדגיש את האתגרים שעומדים בפניה, ותנסה למקד את המחקר לפתרונם.

מיהם האורחים מחו"ל שישתתפו בכנס?
לכנס הגיעו שניים מבכירי החוקרים בתחום: פרופסור לארי רבינר מ-UCSC ואוניברסיטת ראטגרס, ופרופסור סדאגקו פורי מאוניברסיטת טוקיו. אליהם יצטרפו מומחים מהתעשייה: ד"ר ג'יימס לארסון – סגן נשיא לארסון שירותים טכניים ויו"ר SpeechTEK, העוסק בהגדרת התקנים, וכן פיטר מהוני – סמנכ"ל השיווק של ניואנס, החברה המובילה בעולם בתחום של עיבוד דיבור".

מה חדש במעבדה לזיהוי הדיבור במכללת אפקה?
"לפני כשנתיים וחצי הקמנו את מרכז המחקר ACLP (ר"ת Afeka Center For Language Processing). המטרה היתה להקים מרכז מו"פ שיעסוק גם במחקר וגם בפיתוח בתחום של עיבוד שפה, בעיקר מדוברת אבל גם כתובה. מטרתו של המרכז, העובד בעיקר מול התעשייה, הוא להוות מרכז ידע. כאשר הייתי בתעשייה, הרגשתי כי חסר לנו קשר עם האקדמיה, למעט ייעוץ ספציפי במקרים מסוימים. בשנים האחרונות אנו עורכים פרויקטים עם חברות צעירות וותיקות, וכן עם ארגוני מחקר כדוגמת מפא"ת, במטרה לקדם את הפיתוח בתחומים שהחברות הללו מבקשות להיכנס אליהם. כך, למשל, פרויקט גדול שלקחנו על עצמנו גם בלי לקוח הוא הקמת בסיס נתונים לשפה העברית לצורך זיהוי ועיבוד דיבור".

הוא הוסיף, כי "באחרונה קיבלנו אישור לבצע פרויקט מגנטון עם החטיבה הביטחונית של נייס (Nice), המוכרת מערכות לארגוני מודיעין, וצריכה לעבוד עם שפות לא מוכרות. פיתחנו מנוע שיאפשר הוספת שפה אקזוטית באמצעות שפה אחרת, דוגמת אנגלית. אמנם מאבדים חלק מהאיכות בדרך, אבל זה עדיף על כלום".

לדבריו, "צוות המעבדה מונה 15 חוקרים, בהם ד"ר ורד אהרונסון – העוסקת בזיהוי רגשות בדיבור ובטקסט, מיכל גשרי – בלשנית, ונעם לוטנר – חוקר זיהוי דיבור. בקרוב יצטרף אלינו ד"ר איציק לפידות, שיעזור בזיהוי דובר. השאיפה שלנו היא לעסוק בכל ההיבטים של ה-Speech: דיבור, דובר ורגשות".

ומה עושה פה רובוט?
"הרובוט אפי, שמסוגל לקבל פקודות קוליות ואף לענות עליהן, הוא רכש חדש של המעבדה. רק חודש אצלנו וכבר עובד קשה. הוא יפתח את הכנס בדיאלוג עם גשרי, ויציג את המרצים האורחים. אנו נשתמש בו למחקרים בתחום עיבוד הדיבור".

תגובות

(1)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. רפי חנה

    עמי עלה והצלח. התחום בהחלט פורץ טכנולוגיות. אמליץ לפתוח תחום "קשר אלחוטי" באפקה, ולשלב את הטכנולוגיות. בהצלחה רפי חנה

אירועים קרובים