במה שנראה כמו קו עלילה מתוך סרט מדע בדיוני, לפני כחודשיים התאספו 30 מהמתמטיקאים הבכירים בעולם לסוף שבוע סודי בברקלי, קליפורניה, כדי להשתתף בניסוי יוצא דופן. המטרה הייתה: תחרות מוחיים מול בינה מלאכותית בשם "o4-mini", כך פורסם באתר המדעי "livescience".
נראה שככל שהשאלות נעשו מסובכות יותר כך גם התשובות של הבוט הפכו מבריקות, מדויקות ולעיתים גם חצופות. הפגישה נערכה באווירה כמעט חשאית עם הסכמי סודיות ושימוש באפליקציית "Signal" בלבד. בנוסף הוחלט על פרס כספי של 7,500 דולר לכל שאלה שהבינה המלאכותית לא תצליח לפתור.

"צפיתי בבוט פותר בזמן אמת בעיה ברמת דוקטורט, שלמיטב ידיעתי לא נפתרה בעבר", סיפר קן אונו, פרופסור למתמטיקה מאוניברסיטת וירג'יניה. "הוא לא רק ענה, הוא ניתח, בנה גרסת ביניים פשוטה, ואז חזר לפתרון השלם. זה בדיוק מה שמדען אנושי עושה וזה היה מפחיד", הסביר הפרופסור.
"o4-mini" הוא מודל שפה מתקדם שפותח על ידי "OpenAI". המודל אומן לא רק על מילים אלא גם על תהליכי חשיבה. הוא לא נבנה להיות מכונת חישוב, אלא מוח סינתטי שחושב. במשך יומיים ניסו המתמטיקאים להכשיל אותו, אך במקרים רבים מצאו את עצמם מובסים

מי שהוביל את המבחנים הוא ד"ר אליוט גלייזר, שסיים את הדוקטורט שלו רק לאחרונה. הוא הצטרף לפרויקט בשם "FrontierMath", שבו הוזנו לבוט מאות שאלות חדשות. חלקן נכתבו במיוחד על ידי חוקרים אנושיים במטרה להקשות עליו.
ככל שחלף הזמן, התברר כי הבוט הצליח להתמודד גם עם שאלות שמעטים בעולם יודעים לפתור. בעוד שבמבחנים דומים, מודלים קודמים הצליחו לענות נכון על פחות מ-2% מהשאלות, המודל "o4-mini" עמד על 20% ואף יותר כשהוא הלך והשתפר.

מה יקרה כשנגיע לרמה 5?
כעת שואלים החוקרים: מה יקרה כשהבינה המלאכותית תגיע לרמה 5, לשאלות שגם הגאונים שבגאונים לא מסוגלים לפתור? בינתיים, המתמטיקאים ממשיכים להמציא שאלות, והבוטים ממשיכים להפתיע.
