בעקבות אירוע | בכירי החוקרים בתחום זיהוי הדיבור הציגו את חזונם המרכז לעיבוד שפה במכללת אפקה
בכנס הוצגו מחקרים המבוצעים במרכז לעיבוד שפה במכללת אפקה, באקדמיה ובתעשייה בארץ ובעולם והתקיימו מושבים בנושא: זיהוי דיבור, זיהוי דובר, ממשק אדם מכונה, אפליקציות, זיהוי רגשות, ועוד
השבוע התקיים במרכז לעיבוד שפה במכללת אפקה קיים השבוע את הכנס הבינלאומי השנתי השלישי בנושא טכנולוגיות עיבוד דיבור. הכנס משך אליו כמה מהחוקרים המובילים בתחום עיבוד הדיבור. בין היתר לקחו חלק שניים מחלוצי התחום שהגיעו לחלוק את חזונם ומשנתם בנושא: פרופ' צ'ין הו-לי (Chin-Hui Lee), מ-Georgia Institute of Technology – ארה"ב ולצידו פרופ' לארי רבינר מאוניברסיטת ראטגרס. לאלה נוספו גם חוקרים ומומחים ממספר אוניברסיטאות ברחבי העולם. בראש הכנס עמד פרופ' עמי מויאל, ראש המרכז לעיבוד שפה במכללת אפקה להנדסה. עוד הוצגו בכנס מחקרים בנושאי ממשק אדם – מכונה, אפליקציות, בריאות וזיהוי רגשות.
פרופ' צ'ין הו-לי בחר להציג את חזונו בהתקדמות טכנולוגיית עיבוד הדיבור. לדבריו, הטכנולוגיה כפי שאנו מכירים אותה כיום הגיע למיצוי. פרופ' לי למעשה הביע את תקוותו לקפיצת מדרגה בטכנולוגיה ושיפור ביצועים דרמטי. לדבריו על החוקרים לפתח ולהציע מספר גישות חדשות לחקר התחום. על פי אחת הגישות, אותה הציג פרופ' לי, על המחקר בתחום לעבור לעיבוד אותות בסיסי ולהתחבר לאות הדיבור עצמו בשלב מוקדם ככל האפשר.
עמיתו, פרופ' לארי רבינר בחר לחשוף לראשונה בכנס במכללת אפקה את ספרית MATLAB החדשה שפיתח במיוחד לצרכי תחום זיהוי הדיבור. למעשה מדובר במעין "ארגז כלים" בסיסי שיוכל לשמש את החוקרים. משמעות המהלך שהציג פרופ' רבינר במסגרת הסמינר שנערך ביומו השני של הכנס היא הנגשת התחום והפיכתו לפחות מורכב, דבר שצפוי לקדם את המחקר בשנים הקרובות.
יו"ר הכנס, פרופ' עמי מויאל הציג את חזון ה-Speech Indexer. מדובר בחזון הרווח בקרב אנשי זיהוי ועיבוד הדיבור. לדבריו, כולם שואפים להגיע למצב בו במקום מספר רב של מנועי דיבור שכל אחד מכוון לפעולה אחת בלבד, נגיע למצב בו קיים מנוע יחיד שמסוגל להוציא מידע שלם ומקיף אודות הקלט הקולי ולענות על מספר שאלות דוגמת: מי הדובר? מה מינו? איזו שפה מדבר?. לדבריו המחקר האקדמי בנושא מתקדם לכיוון זה אם כי הדרך עוד ארוכה.
פרופ' מויאל התייחס גם לקיומו של הכנס השנתי: "הדינאמיות וההתקדמות של תחום עיבוד הדיבור מבהירה את חשיבותו של קיום הכנס. רק בשנה שעברה גולת הכותרת של הכנס הייתה טכנולוגיית סירי של אפל, וכיום, שנה לאחר מכן, הפכה גולת הכותרת להיות סביב מערך ההאזנות והמודיעין העולמי. כפי שהניסיון מלמד, ייתכן והכנס שייערך בשנה הבאה יעסוק בנושא שאנחנו עדיין כלל לא מכירים".