יאללה מכות?

בשורה רעה למְפֵרי הסדר: חוקרים פיתחו אלגוריתם של "ראייה ממוחשבת" שמסוגל לאתר במהירות פעילות אלימה המתפתחת בקרב המונים. אם הפיתוח החדשני יוכנס לשימוש - יהיה קל יותר להילחם באוהדי כדורגל מתפרעים

שוו בנפשכם אצטדיון כדורגל ענקי. 20 אלף אוהדים משתי הקבוצות היריבות משתוללים, קופצים, צועקים ומניפים דגלים. מסביב פזורות מצלמות אבטחה, ובחדר הבקרה יושב בחור צעיר ומתבונן בעת ובעונה אחת בשישה צגי מחשב. כעבור שעה הוא כבר עייף מבליל הפרצופים, ועדיין מבטו הלאֶה עובר ממסך למסך, מחפש מוקד של התפרעות. הכל כבר נראה לו אותו דבר, וממילא – זה משחק רגוע, לא?

החוקרים בדקו אילו סטטיסטיקות של שינויי תנועה בפריימים מעידות על הופעת אלימותצילום: שאטרסטוק
החוקרים בדקו אילו סטטיסטיקות של שינויי תנועה בפריימים מעידות על הופעת אלימות
צילום: שאטרסטוק

אז זהו, שלא. דווקא אז, כשערנותו של המאבטח צונחת, מתחילה מהומה ביציע ג', אגף 5, שורות 42־43. אלא שבתנאים אלו יחלפו חמש דקות תמימות עד שיבחין בהתרחשות ויזעיק עזרה. חמש דקות שבהן, אולי, אפשר היה להציל חיים.

עבור ד"ר טל הסנר, מומחה לראייה ממוחשבת במחלקה למדעי המחשב באוניברסיטה הפתוחה, חמש הדקות הקריטיות האלה היוו אתגר. ד"ר הסנר, עם הסטודנטים יוסי איצ'ר ואורית קליפר־גרוס, יצא לחפש אלגוריתם ממוחשב שינסה לצמצם את הפער הקריטי הזה בין התפרצות אירוע אלים בהמון לבין יכולת התגובה האנושית שתביא להשתלטות עליו. באמצעות יישום מסחרי של טכנולוגיה זאת, ייתכן שמצלמות האבטחה יוכלו לזהות התפרצות של אירוע אלים כזה הרבה יותר מהר, לסמן את נקודת הרתיחה ולהתריע. כמה מהר? תוך ארבע שניות. ארבע שניות עד שהמאבטח המותש שמתבונן באימג' מטושטש ואילם המחולק לשישה מסכים יקבל צפצוף שיעיד כי במסך מספר שלוש זוהתה תנועה חשודה המאפיינת אירוע אלים.

לתת למחשב עיניים

אל המחקר על זיהוי אלימות בהמון הגיע ד"ר הסנר כתוצאה מסקרנות. "התבוננתי כצופה מהצד. אני לא עובד בשביל תעשייה כלשהי ולא מפתח טכנולוגיות במסגרת פיתוח מוצר מסחרי; אני מפתח טכנולוגיות במסגרת מחקר אקדמי. לא בהכרח חשוב לי לשרת את התעשייה – אבל אני כן מתבונן בבעיות שמטרידות אותה. נושא זיהוי אלימות נראה לי מסקרן ומאתגר מאוד. חשבו על כך שכל הפרויקטים של 'ערים ללא אלימות' כרוכים בעלויות הקמה גבוהות מאוד של מערכות הכוללות אינספור מצלמות. חשבתי לעצמי, 'אוקיי, אבל מישהו צריך לצפות בכל המצלמות האלה, לעבור על כל החומר'. יש גבול לכוח האדם שאפשר להעסיק בצפייה בסרטים, ויש גם גבול למספר המסכים שאדם אחד יכול לכסות בו זמנית. יש מאמרים המעמידים את הצפייה הסימולטנית במסכים בסימן שאלה – כי זה מצריך כושר ריכוז עצום, ומתחיל לשעמם מהר מאוד. ונניח שאדם יצא לרגע לשירותים או להכין כוס קפה, ובדיוק בדקה הזאת מישהו נרצח? בקיצור, זה לא פתרון מספק".

הסנר והסטודנטים שלו חיפשו דרך שבה יוכלו "לתת סימנים" במיליוני הפריימים שאוספות מצלמות האבטחה. "התבוננו בסרטים רבים המדמים מצלמות אבטחה וניסינו לאתר אילו סטטיסטיקות של שינויי תנועה בפריימים מעידות על הופעת אלימות. באופן כללי מדובר בשינויים מקומיים בגוונים ובצבעים של הפיקסלים. הפעלנו שורת חישובים על השינויים האלה וכך ביססנו את המדד לשינוי בתמונה, המעיד כי מתחילה להתפתח פעילות אלימה".

מה בעצם משתנה בתמונה שיכול להעיד שמישהו סוטר למישהו או דוחף אותו? האם אפשר להצביע על שינויים קונקרטיים כאלה?

"לצערי לא. מדובר בשינויים נקודתיים זעירים, שרק צירוף של רבים מהם יכול להעיד על פעולה אלימה. לכן זהו אלגוריתם מתמטי והוא לא יחול בכל המקרים. האלגוריתם שלנו יזהה, למשל, היווצרות של 'פטריית' קהל המתפתחת סביב קטטה. אך אין לנו שום דרך לזהות סכין הננעצת בגבו של מישהו בקרב קהל המוני אם לא יהיה שינוי בסביבתו שיעיד על כך".

אתם הרי בעצם מקלים על עובדי האבטחה. מעבידיהם עלולים להיות מוטרדים מכך שהם ינמנמו וימתינו לאזעקות במקום לצפות בערנות במסכים.

"אני מסכים עם הטיעון הזה. זו גם הסיבה שרופאים רבים אינם רוצים להסתמך על מערכות רפואיות שיסייעו בידם לקבל את ההחלטה שלשמה עברו הכשרה ממושכת. הבעיה היא שבסוף, בגלל התנגדותם למערכות ממוחשבות, הם נועצים בגוגל כשהם מבקשים לקבל החלטה מושכלת על הטיפול שעליהם לתת. זאת שאלה שיצטרך לשאול את עצמו מי שייקח את האלגוריתם שלי הלאה, וינסה לתרגם אותו לשימוש אפקטיבי. בינתיים אני מסתפק בהישג המדעי".