במחקר שפורסם בכתב העת "Nature Communications", דיווחו חוקרים כי סדר הפעולות שבו המוח האנושי מעבד שפה מדוברת תואם להפליא את אופן העיבוד של מודלי שפה גדולים. הממצאים מראים כי הן המוח והן מודל הבינה המלאכותית מטפסים על אותו "סולם" שלבי, החל מקליטת האות האקוסטי ועד להבנת המשמעות העמוקה של המילים.

המחקר, בהובלת אריאל גולדשטיין מהאוניברסיטה העברית בירושלים, התבסס על מערך נתונים ייחודי: תשעה חולי אפילפסיה, שבמוחם כבר הושתלו אלקטרודות מסיבות רפואיות קליניות, האזינו לפודקאסט במשך 30 דקות בזמן שהפעילות העצבית שלהם הוקלטה ישירות בדיוק גבוה. החוקרים השוו את תזמון הפעילות המוחית הזו, אזור אחר אזור, לעבודה הפנימית של מודל שפה גדול שעיבד את אותן המילים שכבס אחר שכבה.
ההתאמה שנמצאה הייתה כמעט זהה. השכבות המוקדמות של המודל, המטפלות במאפיינים הבסיסיים ועל פני השטח של השפה, התאימו לתגובות המוחיות המוקדמות ביותר. לעומת זאת, השכבות העמוקות יותר של המודל, הלוכדות הקשר ומשמעות, התאימו לפעילות מאוחרת יותר באזורי מוח כמו אזור ברוקה, המזוהה מזה זמן רב עם עיבוד שפה. שתי המערכות נעו באותו הרצף: מאות האקוסטי, לצלילי הדיבור, למילים בודדות, ולבסוף למשמעות. המיקום של המודל בערימת השכבות שלו תאם במדויק את המועד והמיקום של המוח בתהליך העיבוד שלו.

למרות התוצאה המדהימה, החוקרים מדגישים כי יש לקרוא את הנתונים בזהירות. המחקר מראה על הלימה בין שני סטים של ייצוגים, אך אינו מהווה הוכחה לכך שהמוח מריץ את אותם החישובים כמו מודל טרנספורמר. שתי המערכות בנויות ומאומנות בדרכים שונות לחלוטין.
האחת על ידי האבולוציה וחיים שלמים של הקשבה, והשנייה באמצעות סטטיסטיקה על ערימות ענק של טקסט. מה שהן חולקות, כך נראה, הוא את "צורת הפתרון" – טיפוס שכבתי מצליל למשמעות. הסיבה לכך עשויה להיות פשוטה: הפיכת דיבור למשמעות היא בעיה ששכבותיות טבועה במהותה, ולכן שתי מערכות שונות לחלוטין שמנסות לפתור אותה הגיעו לאותם שלבים באופן עצמאי. התכנסות לפתרון דומה אינה מעידה על עיצוב פנימי משותף.

למרות זאת, ההתאמה הזו עדיין בעלת חשיבות רבה. היא מעניקה למדעני מוח מודל קונקרטי שניתן לבחינה לגבי האופן שבו הבנת השפה מתפתחת במוח. בנוסף, היא מחלישה תיאוריות ישנות שהתייחסו להבנה כיישום של חוקים דקדוקיים פורמליים, ומצביעה במקום זאת על בנייה סטטיסטית והדרגתית של משמעות. ככל שמודלים אלה מנבאים טוב יותר את פעילות המוח, כך הם יכולים לשמש ככלים יעילים לחקר המוח עצמו, בלי קשר לשאלה אם הם מהווים תמונה מדויקת שלו או לא.
