זיהוי דיבור וקול בשירות הדור השלישי

ה-OCR וה-ICR הם לא מושגים חדשים, אולם קישורם לעולם המובייל הוא חדש בהחלט ● שיחה עם איגור פודורטס, מנהל בכיר ב-ABBYY הרוסית, על העתיד של אחד התחומים המרתקים והשימושיים ביותר בסלולריים שלנו

שניים מהתחומים המתפתחים ביותר בעולם הסלולר כיום הם OCR (זיהוי טקסט מודפס) ו-ICR (זיהוי כתב יד). התחומים הללו אינם חדשים לעולם, אולם בהחלט חדשים לשוק הסלולר.

בשבוע שעבר ביקר בישראל איגור פודורטס, מנהל בכיר ב-ABBYY הרוסית, שמתמחה בזיהוי אופטי ולינגוויסטיקה, והתאמתם למכשירי טלפון חכמים. ABBYY הוקמה ברוסיה ב-1989. היא מעסיקה 900 עובדים בכל העולם, שליש מהם מהנדסים המתמחים בפיתוח פתרונות בתחום זיהוי הטקסט והדיבור. היא מפעילה משרדים בארה"ב, גרמניה, בריטניה, יפן, טייוואן ואוקראינה. בישראל היא משווקת את מוצריה באמצעות חברת מאגרי תוכנה, בהנהלת חיים רון, שגם אירח את פודורטס וחבריו בביקורם הרשמי בארץ.

לדברי פודורטס, מוצרי החברה כוללים מצד אחד ערכות פיתוח (SDK), ומהצד השני, פתרונות Data Capture – עיבוד מסמכים מובנים ולא-מובנים (ABBYY Flexi Capture). המהנדסים של ABBYY פיתחו גם פתרון לעריכת קבצי PDF והמרתם לקבצי וורד – בעיה מוכרת לכל מי שהתמודד עם הפורמט הזה.

אבל הכיוון, אומר פודורטס, הוא יישומים ניידים, מה שדורש ערוצים אחרים. לדוגמה: יישום שלאחר שמצלמים כרטיס ביקור בסלולר, הוא יודע לזהות את התווים, ולאחסן אותם כמידע – לא כתמונה – בספר הכתובות. "יש לנו מספר סוגי יישומים שהתחלנו למכור בישראל דרך פרטנר", הוא מציין.

לדברי פודורטס, תחום ה-OCR נכנס באופן מסיבי גם לרשתות החברתיות. "עבור ה-iPhone פיתחנו קורא כרטיסי ביקור שמתקשר גם לרשתות חברתיות. כך, כשמצלמים כרטיס ביקור, אפשר לחפש ברשתות חברתיות מידע נוסף אודות האדם וללמוד עליו עוד אחרי הפגישה".

ב-ABBY זיהו את הפוטנציאל הרב שטמון בשווקים המבוססים על שפות שמיות – לרבות השוק הישראלי, ופיתחו פתרונות ייעודיים לדוברי השפות הללו. "ב-OCR יש אתגר: אם האיכות לא מספיק טובה, והמוצר כולל שגיאות רבות, אנשים לא ישתמשו בו. כשהאיכות מגיעה לרמה גבוהה מספיק, נפתחות הזדמנויות שימוש יומיומיות. לשמחתנו, הגענו לתוצאות טובות בזיהוי עברית, שמאפשרות לאנשים לאמץ OCR ככלי שימושי. בין לקוחותינו בישראל: ידיעות טכנולוגיות – המשתמשים ב-OCR של החברה לזיהוי וסריקת ספרים מודפסים ללא גרסאות אלקטרוניות, אוניברסיטת בר אילן ולקוחות פרטיים רבים".

OCR בגרסת המובייל כולל גם פתרונות שיכולים לסייע למוגבלי ראייה ועיוורים. "עיוורים יכולים להניח את הספר או הדף על סורק או מכשיר זיהוי, ולאחר שהטקסט ייסרק ויעבור דרך תוכנת ה-OCR – הוא יהפוך לדיבור שהם יוכלו לשמוע", הוא אומר. לדבריו, ABBYY מספקת את ערכת הפיתוח לפתרון הזה, ואת היישום בישראל מבצעות החברות תשר געש ו-Let's Talk.

עם זאת, מודה פודורטס, כי בניגוד באנגלית – עדיין יש להם עבודה רבה בעברית. "בעברית יש בעיה של אותיות דומות, כתיבה מימין לשמאל והצורך לטפל בכתיבה דו-כיוונית (שילוב של שפות אחרות בטקסטים בעברית)".

השורה התחתונה: איגור פודורטס משוכנע, כי תחום זיהוי הטקסט והפיכתו לדיבור, ימשיך להתפתח בעולם המובייל, ויגיע לכיוונים שעלולים להיראות כיום כלא מציאותיים. לדוגמה: נניח שיצאתם לטייל בחו"ל ופתאום אתם נזקקים למרשם רופא. במקרה כזה, תוכלו לסרוק את שם התרופה שקיבלתם מהרוקח המקומי, ולקבל מיד את המקבילות שלה בישראל – עובדה שתקל על החלטתכם האם להשתמש בתרופה או לא. זו, כמובן, רק דוגמה קטנה למה שעוד מצפה לנו בעתיד.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים