Cloud Vision API: הכלי שמאפשר "להבין" תוכן של תמונות
גוגל הכריזה על הדבר שישדרג כל סטארט-אפ וארגון - כלי שבעזרתו ניתן לבנות Metadata על קטלוגים של תמונות, לזהות את אלה המציגות תוכן פוגעני או לאפשר תרחישים שיווקיים חדשים על בסיס ניתוח הבעות ורגשות המופיעים בהן ● וזה לא הכול
גוגל (Google) הכריזה על השקת Google Cloud Vision API, כלי המיועד למפתחים ומאפשר להם לבנות אפליקציות ש-"מבינות" מה התוכן שמופיע בתמונות.
Cloud Vision API מסוגל לסווג תמונות במהירות עצומה על פי אלפי קטגוריות שונות (למשל "ספינה", "אריה", "מגדל אייפל"). הוא מזהה פנים ומייחס להם הבעות ורגשות, ואף מזהה מלים במגוון שפות המופיעות בתמונה. בעזרת הכלי ניתן לבנות Metadata על קטלוגים של תמונות, לזהות תמונות המציגות תוכן פוגעני, או לאפשר תרחישים שיווקיים חדשים על בסיס ניתוח הבעות ורגשות המופיעים בתמונות.
להלן מספר יכולות של Cloud Vision API שניתן להפעיל, בנפרד או בכל שילוב ביניהן, על תמונות ברשת:
● זיהוי ישויות – ניתן לזהות את הישות הדומיננטית בתמונה (למשל מכונית, חתול), מתוך קבוצה רחבה של קטגוריות אובייקט. כך ניתן להשתמש ב-API לבניית metadata על כל קטלוג תמונות, ובכל לאפשר תרחישים חדשים כמו חיפושים או המלצות מבוססי תמונה.
● זיהוי אופטי של תווים ואותיות – מאפשר לייצא טקסט מתוך תמונות. ה-API כולל זיהוי שפה אוטומטי ותומך במגוון רחב של שפות.
● זיהוי תוכן פוגעני – מבוסס על Google SafeSearch ומאפשר לפקח בקלות על תוכן פוגעני המופיע בתמונות.
● זיהוי פנים – מזהה אם בתמונה מופיעים פנים אנושיות, לרבות זיהוי של חלקי פנים כמו עיניים, אף ופה, ומיקומם היחסי. ה-API מזהה גם עד שמונה הבעות רגשיות כגון שמחה, עצב וכד'. יש לציין שהחברה אינה תומכת בזיהוי אישי של אנשים, ואף אינה שומרת מידה של זיהוי פנים באף שרת של גוגל.
● זיהוי אתרים – מאפשר לזהות אתרים מפורסמים כגון פסלים, מבנים קלאסיים, שמורות טבע ידועות ועוד, כולל נקודות הציון של האתר (קווי אורך ורוחב).
● זיהוי לוגואים – מאפשר לזהות לוגו של חברות אשר מופיע בתמונה.
כדי להדגים חלק מהיכולות של Cloud Vision API, המתכנתים של גוגל בנו רובוט שנוסע ומזהה חפצים שונים (בננה, שטר כסף, משקפיים), פרצופים מחייכים ועוד.
Google Cloud Vision API זמין בגרסת Limited Preview.
תגובות
(0)