תתחילו לשקול מילים: בקרוב ינתחו את הסטטוסים שכתבתם

חוקרים פיתחו שיטה לניתוח אישיות באמצעות טקסטים שאנשים כתבו על עצמם ברשתות החברתיות. האם אלה הם פני העתיד? כנראה. הצילו

אייקון פייסבוק
אייקון פייסבוק

בכל יום אנשים נותנים ביטוי למחשבותיהם ולרגשותיהם באמצעות כתיבה ברשתות החברתיות. בכל יום? התכוונו בכל שעה או דקה. את התוצרים, חשובים או מיותרים ככל שיהיו, כולנו חולקים עם חברינו הקרובים, מיודעינו הרחוקים, עם הפרופיל הפיקטיבי שהוסיף אותנו בפייסבוק ומשום מה אישרנו, עם Ḟäćeƅoộk Šĕčủrıtƴ או אפילו עם העולם כולו. התוצאה: השפה הכתובה, הנאגרת בפוסטים ברשתות החברתיות באין מפריע, הפכה למקור עשיר ובלתי נדלה של מידע פסיכולוגי על אנשים.

מקור עשיר – אבל לא מנוצל. חִשבו על כמות המידע שאפשר היה להפיק ועל איכותו – לו ידעו החוקרים לתרגם את השפה הכתובה הנאגרת ברשתות החברתיות לכלי מדידה אמינים ותקפים. למה הכוונה? דמיינו שיכולתם לקבל מידע מפורט ומהימן על האישיות של אנשים ששלחו לכם הבוקר מייל, בלי להצטרך להשתמש בשום מידע נוסף, אפילו לא בילוש נוסף אחריו בפייסבוק.

כעת נראה שהמציאות הזו קרובה מתמיד: במאמר שפורסם בכתב העת Journal of Personality & Social Psychology מציג צוות חוקרים בראשות גרגורי פארק שיטה לניתוח אישיות באמצעות אלגוריתמים לניתוח של השפה הטבעית בטקסטים שאנשים כתבו על עצמם ברשתות החברתיות באינטרנט.

השיטה שפיתחו המדענים מושתתת על תחום שנקרא "עיבוד שפה טבעית". כחלק מתחום ידע זה נבנים אלגוריתמים משוכללים שמטרתם לנתח באופן ממוחשב טקסטים שנכתבו ב"שפת בני אדם" (כלומר, בשפה טבעית). התחום מושתת על אוצר ידע מדיסציפלינות שונות, בהן מדעי המחשב ובלשנות.

איך הכתיבה שלנו מעידה על האופי שלנו?

במהלך העשור האחרון התפרסמו כ־100 מחקרים שקישרו מאפיינים שונים של שפה – למשתנים פסיכולוגיים. כך, למשל, נמצא כי אנשים שקיבלו ציונים גבוהים יותר בשאלונים הבודקים נוירוטיות, נטו יותר להשתמש יותר בשם הגוף "אני" בכתיבתם; כך גם התגלה, אולי שלא במפתיע, אבל באופן מוכח – שאנשים מוחצנים נטו להשתמש יותר בשמות תואר כמו "גדול" ו"אדיר" במסגרת הכתיבה שלהם.

הכל פרוץ. צילום: Shutterstock
הכל פרוץ. צילום: Shutterstock

עד להתפתחות הרשתות החברתיות, חוקרים בתחום השפה הטבעית נאלצו לנתח טקסטים "ישָנים" או "היסטוריים", כפי שהם מכונים על ידי החוקרים, כלומר – הם ביססו את מחקריהם על קטעי ספרות, מאמרים או מכתבים, או שביקשו מנבדקים לכתוב טקסטים חדשים במיוחד עבור המחקר. נשמע מסורבל לעומת המצב כיום – ההתפתחות העצומה של הרשתות החברתיות מימשה עבור חוקרי השפה הכתובה מאוויים נכספים שבעבר יכלו רק לדמיין: מעבדה טבעית שמייצרת מיליוני טקסטים חדשים מדי יום. כדי לסבר את האוזן, לפי דיווחים רשמיים, משתמשי הרשת החברתית טוויטר כותבים יותר מ־500 מיליון פוסטים ("ציוצים") ביום.

לניתוח של השפה הטבעית ברשתות חברתיות יש יתרון משמעותי נוסף כמובן, מעבר לכמות המידע האדירה -והוא שמדובר בשפה שנכתבת מתוך הקשר אמיתי של חיי היומיום, ושרובה מושתתת על כתיבה לחברים ולידידים, או לפחות לאנשים עם תחום עניין משותף ועניין הדדי אלה באלה – ולפיכך רמת הפתיחות בה גבוהה ביותר. ואמנם, לא מפתיע לגלות כי מחקרים קודמים הצביעו על כך שנושא הכתיבה החביב ביותר על אנשים ברשתות החברתיות הוא – אתם יושבים? הם עצמם. אלא שהמחקרים גילו גם כי רבים נוטים להציג את העצמי האמיתי שלהם, ולא פרסונה מזויפת.

אלוהים אדירים, מה גיליתי! צילום: Shutterstock
אלוהים אדירים, מה גיליתי! צילום: Shutterstock

קחו את זה אישית – כך בוצע המחקר

במחקר הנוכחי שפורסם השתתפו לא פחות מ-66,732 נבדקים, שנדרשו להתקין אפליקציה בפייסבוק בה הם ענו מעת לעת על שאלונים פסיכולוגיים, וקיבלו משוב מידי מצד החוקרים. המשתמשים גם אישרו לחוקרים לעשות שימוש בפרסומים שכתבו למעגל החברים שלהם בפייסבוק. החוקרים השתמשו בפוסטים שנכתבו מינואר 2009 עד נובמבר 2011, ובסך הכל -בלמעלה מ־15 מיליון הודעות.

החוקרים בנו אלגוריתמים מורכבים לניתוח השפה של המשתמשים; הם כללו מדדים כמו תדירות שימוש במילים, תדירות ההופעה של ריגשונים (סמיילים. דוגמת 🙁 ), סימני פיסוק (!!!), איות לא קונבנציונלי (u במקום you) ותדירות השימוש בביטויים ובנושאים שונים. החוקרים הצליבו את נתוני השפה ושאלוני האישיות, ובנו מודל המאפשר לתאר את אישיות הכותב על בסיס ניתוח השפה בלבד. לאחר מכן, בדקו החוקרים את יכולת הניבוי של המודל שפיתחו על קבוצה חדשה של 4,824 משתמשי פייסבוק אחרים, שסיפקו אף הם גישה לפוסטים שלהם ומילאו שאלוני אישיות. חלק מנבדקי הקבוצה השנייה התבקשו גם שאדם קרוב יספק מידע נוסף וחיצוני על אישיותם.

מניתוח של נתוני השפה של קבוצת הניבוי (קבוצת הנבדקים השנייה), התברר כי המודל המנתח את השפה של משתמשי הרשת החברתית מספק מידע תקף ואמין על אישיותם. המידע שהפיק המודל עלה בקנה אחד עם המידע שאפשר היה להפיק משאלוני האישיות שמילאו המשתמשים ועם המידע שסיפקו המקורבים שנבחרו על ידי המשתתפים והעריכו חיצונית את אישיות הנבדק.

הרשתות החברתיות מהוות כר בלתי נדלה לאותה "שפה טבעית" העשירה במידע אישי על משתמשים, אולם חשוב לזכור כי הנתונים שהוצגו במחקר הנוכחי תקפים למשתמשי פייסבוק שהיו מעוניינים בניתוח אישיותם, ושאפשרו לחוקרים גישה לדברים שכתבו. כמובן שעולה השאלה עד כמה הם יהיו תקפים למשתמשי פייסבוק שלא אפשרו גישה חופשית לסטטוסים שלהם, או לאוכלוסייה בכלל. עם זאת, הפוטנציאל הגלום בשיטה זו הוא אדיר.

מפחיד? כי זה כבר כאן

לפני סיום, בשבועות האחרונים געשו הרשתות החברתיות ואתרי האינטרנט מהשקתו של אתר המאפשר שירות חדשני: מקלידים את שמו של אדם, והאתר מספק ניתוח אישיות מפורט. לדברי יוצרי האתר, הם עשו שימוש בנתונים שאנשים כתבו על עצמם בפרופילים שלהם ברשת החברתית עסקית Linkedin. כמו פארק ועמיתיו, גם יוצרי אתר זה בנו אלגוריתם של עיבוד שפה טבעית המתרגם מידע הזמין לכל לתכונות אישיות. "מבהיל", "מחריד" ו"מבעית" טענו גולשים רבים שהקלידו את שמם והצטמררו לגלות ניתוח מדיוק למדי של עצמם.

ההשלכות של אתר זה, כמו של תחומי מחקר נוספים המתבססים על הממשק שבין ניתוח שפה טבעית ופסיכולוגיה, הן רבות. בעתיד אולי אפשר יהיה לנבא את מצב רוחו של הבוס מתוך המייל האחרון שכתב לכם, או להפיק מידע על עמדותיהם ואמונותיהם של אנשים בלי שפגשתם אותם כלל. המרחק מכאן לשאלות קיומיות קצר: האם זה סופו המוחלט של עידן הפרטיות? האם אי פעם הייתה לנו בכלל פרטיות מאז עלייתן של  הרשתות החברתיות? יתכן שלא נדע בוודאות. אולי תשאלו את החברים שלכם בפייסבוק.