צילום: שאטרסטוק

הסנדלר הולך יחף: המודל AI הכי מאובטח של אנת'רופיק - דלף

אליהו עמר

ט אייר ה'תשפו (26.04.26)

חברת אנת'רופיק חשפה מודל AI עוצמתי במיוחד המסוגל לאתר פרצות אבטחה קריטיות באופן אוטונומי, אך סירבה לשחררו לציבור בשל החשש שיהפוך לכלי נשק • למרות אמצעי הזהירות, קבוצת משתמשי דיסקורד הצליחה להשיג גישה למודל "הכלוא" לאחר שניחשה בקלות את מיקומו בשרתי החברה • פרטי הסיפור המוזר

רוצה שנקריא לך?

בתחילת חודש אפריל האחרון, עולם הטכנולוגיה עצר את נשימתו כאשר הכוכב העולה בשמי הבינה המלאכותית, חברת אנת'רופיק (Anthropic), חשפה את Claude Mythos. לא היה מדובר בעוד צ'אטבוט ידידותי לכתיבת מיילים, אלא במפלצת קוד שתוכננה למטרה אחת: פירוק מערכות. המודל החדש נחשב למתקדם כל כך עד שהחברה הצהירה כי הוא מסוכן מכדי להשתחרר לקהל הרחב. על פי אנת'רופיק, המודל מסוגל לזהות פרצות אבטחה ופרצות Zero-Day (חולשות שטרם התגלו) במהירות ובקנה מידה שחוקרי אבטחה אנושיים, מנוסים ככל שיהיו, פשוט לא מסוגלים להתחרות בו.

המודל קלוד של אנתרופיק | צילום: שאטרסטוק

יכולותיו של Mythos נשמעות כמעט דמיוניות. בניגוד למודלים סטנדרטיים שעוזרים למתכנתים לכתוב קוד, Mythos אומן לפעול באופן אוטונומי על גבי מערכות קיימות. הוא כבר הספיק להוכיח את עוצמתו כשחשף אלפי פרצות אבטחה קריטיות במערכות ההפעלה ובדפדפנים המובילים בעולם. בין היתר, המודל הצליח לאתר פרצה "רדומה" בת 27 שנים במערכת OpenBSD וליקויים בקרנל של לינוקס שאפשרו השתלטות מלאה על מכונות. עבור אנת'רופיק, היה ברור שמדובר בכלי שיכול לשמש כנשק הרסני אם יגיע לידיים הלא נכונות.

כדי למנוע תרחיש אימה שכזה, השיקה החברה את "פרויקט Glasswing" – יוזמה שנועדה לאפשר גישה למודל רק למספר מצומצם מאוד של שותפות אסטרטגיות. הגישה ניתנה בתוך סביבה מבוקרת ומבודדת, מעין "גן סגור" שאמור היה להבטיח שהיכולות התקיפיות של Mythos יישארו תחת פיקוח הדוק. החברה התגאתה בכך שהיא מסוגלת לנטר כל פעילות של המודל ולהבטיח שאף גורם לא מורשה לא יצליח לחדור למערכת או להשתמש בה לרעה.

דריו אמודיי, מנכ"ל אנתרופיק | צילום: שאטרסטוק

אולם, המציאות טפחה על פניה של אנת'רופיק בצורה הכואבת ביותר. המודל ה"כלוא" והמסוכן מצא את דרכו החוצה, ולא באמצעות מבצע פריצה הירואי של מדינת אויב או נוזקה מתוחכמת. על פי דיווח של בלומברג, קבוצה של משתמשים לא מורשים הצליחה להשיג גישה למודל פשוט על ידי "ניחוש מושכל" של מיקומו בשרתי החברה. חברי הקבוצה הצליחו לחבר חלקי מידע שדלפו מפריצה קודמת לחברת דאטה בשם Mercor, יחד עם מידע פנימי שהגיע מחבר קבוצה שעבד כקבלן חיצוני עבור אנת'רופיק. השילוב הזה איפשר להם לאתר את Mythos בקלילות מביכה.

למרבה המזל, ה"פולשים" לא היו האקרים זדוניים אלא קבוצת סקרנים מאפליקציית דיסקורד. למרות הסוף הרגוע יחסית, האירוע חושף מחדל אבטחתי חמור באחת מחברות ה-AI המובילות בעולם. אנת'רופיק, שממתגת את עצמה כחברה האחראית והבטוחה ביותר בשוק, לא רק כשלה בשמירה על המודל המסוכן ביותר שלה, אלא שאפילו לא ידעה על הדליפה עד שהעיתונאים פנו אליה. האירוניה המרה התפוצצה בפרצוף של כולם: המודל שיכול לזהות כל פרצה בעולם, לא הצליח להגן על היוצרים שלו מפני רשלנות אנושית בסיסית.

בינה מלאכותיתקלוד

הסנדלר הולך יחף: המודל AI הכי מאובטח של אנת'רופיק - דלף

רוצה שנקריא לך?

חוששים שמצלמים אתכם בלי רשות? מטא תעשה לזה סוף בשבילכם

לקראת בחירות 2026: כך תוכלו לזהות תעמולה שנוצרה ב-AI

מייסד ChatGPT טוען: כך ה-AI מתחיל להתעלות על השכל האנושי

מצא ציור ברחוב בשביל המסגרת - וגילה שהוא שווה הון

מדריך להשמדה המונית בכיס: הכשל הענק של חברות הטכנולוגיה