בינה מלאכותית היא כלי מבריק. הבעיה שלה היא ההורים שלה, אנחנו

"סוכן נכנס לחדר הסיני, בו יושב אדם שלא יודע סינית", לפי מידג'ורני
"סוכן נכנס לחדר הסיני, בו יושב אדם שלא יודע סינית", לפי מידג'ורני

הדבר המפחיד באמת במחשבים שיודעים לצייר ציורים או לכתוב טקסטים זו לא המחשבה שעוד שניה הם יקחו את העבודות שלנו. זה לראות אותנו ואת מה שאנחנו כתבנו וציירנו משתקף אלינו בחזרה ממה שהם יודעים לפלוט אלינו

16 בדצמבר 2022

סוכן חשאי נשלח לחקור מתקן תת-קרקעי סודי בשם "החדר הסיני". לחדר אפשר להכניס פתק ובו שאלה כתובה בסינית, ולקבל בתמורה פתק עם תשובה כתובה בסינית. הסוכן מתגבר על מלכודות, לייזרים ושומרים חמושים, פורץ את המנעול של החדר ומגלה שם אדם מוקף בספרים עבי כרס. האדם אינו יודע מילה אחת בסינית, אבל כשהוא מקבל פתק בסינית הוא יודע לנבור בהוראות, שמסבירות לו שאם מצויר על הפתק קו כזה וכזה, ולידו שני קווים כאלו וכאלו, הוא צריך לעבור להוראה בעמוד כזה וכזה ושם מוסבר לו איזה קו לשרטט, וכך הלאה עד שמתקבלת תשובה בסינית.

לא צריך להיות מצויד באינסטינקטים מחודדים של סוכן חשאי בשביל לנחש שהבעיה הזאת, שניסח הפילוסוף ג'ון סרל ב-1980, היא אנלוגיה חיננית לדרך בה עובד מחשב. אני חושב על "החדר הסיני" לסירוגין לאורך 25 השנים האחרונות, מאז שקראתי עליו בגיליון של מגזין המחשבים המיתולוגי "זומביט". אני משוכנע שזה היה דווקא שם: לפני כמה שנים הופתעתי לגלות שהסוכן החשאי והאקשן היו בסך הכל תוספת ציורית של הכותב, ובבעיה המקורית של סרל יש רק את החדר ואת היושב בו. אבל החדר הסיני נחקק בזיכרון שלי לכל החיים לא רק בגלל הדימוי המקורי אלא בגלל האופן בו נוסחה השאלה שבסופו: "האם בחדר קיימת הבנה כלשהי של השפה הסינית?". אם אין מבין, האם יכולה להתקיים הבנה? ואם כן, איפה? האם היא מרחפת בחלל החדר? האם היא בספרים? אולי היא באצבעות המדפדפות?

"אנה קרנינה רואה אקורדיון לראשונה". איפה האקורדיון, מידג'ורני? איפה הוא?
"אנה קרנינה רואה אקורדיון לראשונה". איפה האקורדיון, מידג'ורני? איפה הוא?

בשנה האחרונה האינטרנט הוצף ביצירות שיוצרו איפשהו בתוך החדרים הסיניים של מערכות הבינה המלאכותיות. כמו בהתפתחות השפה האנושית, קודם קיבלנו את הציורים של DALL-E, אחר כך את הציורים המתקדמים יותר של מידג'ורני, ורק אחר כך את הצ'אטים, המאמרים, המכתבים ותסריטי "סיינפלד" של ChatGPT. התגובות נעו בין פליאה לחרדה. המודאגים דאגו מההיבטים המשפטיים של התוצרים של מערכות שאומנו על עבודות של אמנים בשר ודם, דאגו לפרנסה שלהם עצמם, דאגו למוסריות או לחוסר המוסריות שבשימוש במערכות האלו. המתלהבים התלהבו מהכלים החדשים שעומדים לרשותם, בין אם הם ניסו לתעל אותם לטובת עבודה רצינית או למאשאפים קומיים שרק רצו לבדוק כמה רחוק אל תוך הנונסנס אפשר לקחת את המכונות, כמו "הייקו על אנה קרנינה שרואה לראשונה אקורדיון".

>> ביקשנו מ-AI לצייר לנו מקומות איקוניים בתל אביב. יצא יפה ומוזר
>> AI על המסך מגיע בשלושה טעמים: חמוד, מפחיד וסקסי
>> ביקשנו מהמחשב להמציא פרקים לסדרות מוכרות. יצא קצת אנטישמי
>> כולם מדברים על אמנות גנרטיבית. אבל מה זה לעזאזל?

אחרי הכל, למכונה עדיין אין חוש הומור (אם יש לכם ספק בכך, רק תנסו לבקש מה-ChatGPT לספר לכם בדיחה). היא תיגש מיד למלאכה מגוחכת באותה טוטאליות בה היא הייתה ניגשת למלאכה אמיתית, בין היתר בגלל שבתוך ארבע הקירות של החדר הסיני אין הבנה של מושגים כאלה – הומור או רצינות. למעשה, כשמבקשים מבינה מלאכותית לייצר משהו מגוחך, הבדיחה היא לא התוצאה. הבדיחה היא עצם העובדה שמישהו הפעיל מחשב משוכלל בצורה בלתי נתפסת על מנת ליצור משהו מיותר לחלוטין וספציפי להחריד.

וזה העניין. חלק עצום מהבאזז סביב תוכן שנוצר על ידי בינה מלאכותית הוא לא סביב התוכן עצמו אלא סביב האפשרות ליצור אותו. לא משנה מה אתם חושבים על הגנרטורים של הבינה המלאכותית. אולי אתם חושבים שהם כלי אוטומציה מופלא שיקל לאמנים את החיים לא פחות מאיך שוייז הקל על החיים של נהגי המוניות (או כל דוגמא אחרת, היסטורית יותר) ואולי אתם משוכנעים שהם פתח לעתיד דיסטופי בו אינספור בעלי מקצוע טובים וחרוצים נזרקים לרחוב בגלל שיש מחשב שעושה את העבודה שלהם יותר טוב, יותר מהר ויותר בחינם מהם (זה לא בדיוק מה שקרה בכל הפעמים הקודמות בהן האנושות יצרה כלים אוטומטיים שהחליפו עבודה ידנית, אבל נניח לזה). אבל צריך להיות מאוד ציני, או מאוד אפאטי, בשביל לחשוב שלא מדובר בכלים מדהימים. הם כל כך מדהימים, והיכולות שלהם כל כך עמוקות ומסחררות, שקל מאוד לפספס עד כמה התוצרים שלהם בינוניים, ובעיקר בנאליים.

ביקשנו את "הציור הכי קיטשי שאתה יכול לצייר". גם המידג'ורני התבלבל
ביקשנו את "הציור הכי קיטשי שאתה יכול לצייר". גם המידג'ורני התבלבל

זה בולט כבר כשמסתכלים על התוצרים של האמנות הגנרטיבית הויזואלית. כל המחוללים הפופולריים עושים כיום עבודה יפה, אסתטית, לפעמים קצת קריפית או משובשת באופן קומי וכמובן מסתבכת עם אצבעות הידיים. העבודה שהם עושים היא מדהימה ביחס למחשב שטכנית, לא יודע מה הוא עושה – לפחות במובנים של "החדר הסיני". אבל מטבעה, בגלל שהיא עובדת על ממוצעים, היא תמיד יוצאת בנאלית גם כשמבקשים ממנה לייצר דברים קיצוניים ומוזרים. לכל תרבות יש את הקיטש שלה: לארצות הברית של תחילת המאה ה-20 היו כלבים שמשחקים פוקר, לאנגליה של המאה ה-19 היו פרחים ורודים רקומים על כורסאות, לשנות ה-90 היו צילומים בשחור לבן של דוגמניות ודוגמניות על אופנועים בשקיעה. מידג'ורני ודומותיה יוצרות קיטש דיגיטלי: צבעים יפים מדי, קווים נקיים, הכל כל כך סימטרי שזה עושה סחרחורת.

ועדיין, התוצרים הויזואליים יכולים להיות מרשימים (וגם שימושיים). מחולל הטקסט ChatGPT הוא סיפור אחר לגמרי והתוצרים שלו הם חלולים באופן כמעט מסקרן. הוא יודע לכתוב תקצירים לכל סדרה פופולרית, הוא משתמש בכל הדמויות הנכונות והוא אפילו יודע לזהות, פחות או יותר, מה, למשל, מערכות היחסים שלהם. אבל לזהות זה עוד לא להבין. בעוד שבמחוללים הויזואליים התוצאות של חוסר ההבנה הזה עדיין יוצאות נעימות לעין, במחולל הטקסטואלי הן יוצרות תוצאות חלולות באופן קצת מטריד, כמו תקציר טלוויזיה שנכתב על ידי האיש הכי משעמם (או הכי משועמם) בעולם.

 

ה-ChatGPT הוא בנאלי מחוסר ברירה. הדבר היחיד שהוא יודע על טקסטים זה לקרוא את מה שאנחנו כתבנו ולעשות מהם, סליחה על הרדוקציה המטורפת, ממוצע כלשהו. כלומר, בנוסף לייעודים המקוריים שלו, הוא גם מנגנון מדהים בשביל לחשוף בנאליות מהי. הטקסטים של ChatGPT משעממים כי אנחנו משעממים. הם בנאליים כי אנחנו בנאליים. אבל עד כה יכולנו לתרץ תירוצים, ועכשיו באות המכונות ובלי שום כוונה (כי כבר אמרנו: אין להן כוונה, ולא יכולה להיות) וחושפות אותנו במלוא הפתטיות שלנו: ככה נראה הממוצע שלנו כי כאלה אנחנו.

אז לא, אנחנו לא צריכים להיות מודאגים מהמכונה. אנחנו צריכים להיות מודאגים ממה שהיה לנו להכניס לתוכה. אנחנו צריכים להיות מודאגים מבני האדם שכתבו טקסטים אוטומטיים לחלוטין עוד בימים שהרעיון של מחשב שיודע לייצר טקסט היה מדע בדיוני.