ראייה ממוחשבת

חוקרים הצליחו לקדם את יכולות הזיהוי הממוחשבות, באמצעות שיפור הזיהוי הממוחשב במאגר עצום של תמונות

באחת הסצנות הזכורות מהסרט "השטן לובש פראדה", מסתובבת עורכת המגזין היוקרתי מירנדה פריסטלי (מריל סטריפ) בין אורחי הנשף שארגנה, ומברכת אותם לשלום. מדי פעם, כאשר פלוני בלתי מזוהה מתקרב לעברה, לוחשת לה באוזנה העוזרת הכנועה המקרקרת לצדה כמה פרטים מזהים: "זה אלן, שזרק לאחרונה את אשתו לטובת רבקה מהפרלמנט" וכו'. עד שהפלוני מושיט את ידו כבר נמרח חיוך על פרצופה של מירנדה: "הו, אלן, כל כך נחמד לראות אותך שוב! מה שלום רבקה?".

האם קרוב היום שבו גברת פריסטלי לא תזדקק לעוזרת המלומדת שתשנן מאות תמונות לפני הנשף? חוקרי זיהוי ממוחשב מאמינים שבעתיד הלא מאוד רחוק תוכל פריסטלי להרכיב "גוגל גלאס" (משקפיים בעלי יכולת להציג אלמנטים של מציאות וירטואלית ה"מולבשת" על פני התצוגה הרגילה – כולל דפי אינטרנט) עם תוכנה המאפשרת זיהוי אנושי ממרחק מספיק כדי לעדכן אותה מי מגיע מהמאגר שהוזן מבעוד מועד. אבל כדי לעבור את המשוכה הזאת יש לשפר את יכולות הזיהוי של המחשבים בשני אלמנטים לוקים בחסר: זיהוי מינו של אדם (האם האיש החולף ברחוב הוא גבר או אישה?) וזיהוי גילו.

עד לאחרונה היה קיים קושי יחסי לצייד מחשבים ביכולות זיהוי שכאלה, במיוחד כאשר היה מדובר בתמונות באיכות ירודה. חוקרים מסבירים כי בעוד תהליך "זיהוי פנים" באמצעות מחשב הוא מתקדם למדי, הרי שזיהוי ממוחשב של מין ושל גיל נשאר מאחור. מחשבים כבר יודעים לזהות מין וגיל בתמונות איכות, כאלה שבהן המצולם משתף פעולה עם המצלם (למשל לצורכי מאגרים ביומטריים, או בתמונות של סלבריטיז על שטיח אדום), אבל מתקשים בתמונות ברזולוציה נמוכה ובאיכות ירודה.

ללא פילטרים

חוקר הראייה הממוחשבת ד"ר טל הסנר מהמחלקה למחשבים באוניברסיטה הפתוחה ערך מחקר בשם "הערכה של גיל ומין בתמונות נטולות פילטר". מחקרו נעשה בשיתוף פעולה עם חברת הסטארט־אפ הישראלית אידאנס, המתמחה בניתוח מידע חזותי המתקבל מטלפונים סלולריים, ומטרתו לקדם את יכולות הזיהוי הממוחשבות, באמצעות שיפור הזיהוי הממוחשב במאגר עצום של תמונות "בלתי מפולטרות", כלומר אותן תמונות מיותרות לכאורה, הנותרות במאגרי הסמארטפונים, האייפדים ושאר אמצעי הצילום הדיגיטליים. ערכן הצילומי של תמונות אלו נמוך (בשל טשטוש, היעדר פוקוס, קומפוזיציה גרועה, מבט צדי של האובייקטים וכדומה).

"נכנסנו לחשבונות של פליקר שהיו עמוסות בתמונות 'בלתי מאורכבות' – כלומר כאלה שאינן חלק מארכיון אלא 'זבל' שהמשתמש לא טרח למחוק, ואף השאיר כחלק מה'פבליק דומיין' (רשות הכלל)", מסביר ד"ר הסנר. "השאלה הראשונה שצריכה להישאל היא מדוע בכלל צריך להתעסק איתן, והתשובה שלי היא פשוטה מאוד: זה מה שהעיניים שלנו רואות, ואת האובייקטים האלה הן צריכות לזהות. בדרך כלל, כשננסה לזהות אנשים ברחוב, להעריך אם מדובר בזכר או נקבה, לנחש את גילו של אדם – לא נעשה זאת בתנאים אופטימליים. אף אחד לא יעמוד מולנו בפוזה הנכונה עד שנזהה אותו. לרוב אנשים חולפים מולנו ביעף, בפרופיל או בתנאי ראייה גרועים וממשיכים הלאה. המטרה שלנו – לאפשר זיהוי קרוב לוודאות שלהם – הושגה".

הסנר אומר שזיהוי גיל ומין היא סוגיה המטרידה את מומחי הראייה הממוחשבת זה 30 שנה. "במחקר הזה הצלחנו להרים את הרף מבחינת דרגת הקושי של הזיהוי והגענו למקומות שטרם הגיעו אליהם במחקרים קודמים. הצלחנו לזהות מין וגיל של מצולמים רבים ברמת ודאות גבוהה, למרות איכותן הירודה של התמונות והאובייקטים המצולמים בהן. מכאן הדרך לזיהוי פרצופים בתנאים קשים התקצרה".