accessibility-icon
share-icon
צילום: שאטרסטוק
צילום: שאטרסטוק

הסנדלר הולך יחף: המודל AI הכי מאובטח של אנת'רופיק - דלף

אליהו עמר

אליהו עמר

ט אייר ה'תשפו (26.04.26)

1

13

like

0

dislike

חברת אנת'רופיק חשפה מודל AI עוצמתי במיוחד המסוגל לאתר פרצות אבטחה קריטיות באופן אוטונומי, אך סירבה לשחררו לציבור בשל החשש שיהפוך לכלי נשק • למרות אמצעי הזהירות, קבוצת משתמשי דיסקורד הצליחה להשיג גישה למודל "הכלוא" לאחר שניחשה בקלות את מיקומו בשרתי החברה • פרטי הסיפור המוזר


רוצה שנקריא לך?

מגישים

בתחילת חודש אפריל האחרון, עולם הטכנולוגיה עצר את נשימתו כאשר הכוכב העולה בשמי הבינה המלאכותית, חברת אנת'רופיק (Anthropic), חשפה את Claude Mythos. לא היה מדובר בעוד צ'אטבוט ידידותי לכתיבת מיילים, אלא במפלצת קוד שתוכננה למטרה אחת: פירוק מערכות. המודל החדש נחשב למתקדם כל כך עד שהחברה הצהירה כי הוא מסוכן מכדי להשתחרר לקהל הרחב. על פי אנת'רופיק, המודל מסוגל לזהות פרצות אבטחה ופרצות Zero-Day (חולשות שטרם התגלו) במהירות ובקנה מידה שחוקרי אבטחה אנושיים, מנוסים ככל שיהיו, פשוט לא מסוגלים להתחרות בו.

maximize-image
images-count1+
המודל קלוד של אנתרופיק | צילום: שאטרסטוק

יכולותיו של Mythos נשמעות כמעט דמיוניות. בניגוד למודלים סטנדרטיים שעוזרים למתכנתים לכתוב קוד, Mythos אומן לפעול באופן אוטונומי על גבי מערכות קיימות. הוא כבר הספיק להוכיח את עוצמתו כשחשף אלפי פרצות אבטחה קריטיות במערכות ההפעלה ובדפדפנים המובילים בעולם. בין היתר, המודל הצליח לאתר פרצה "רדומה" בת 27 שנים במערכת OpenBSD וליקויים בקרנל של לינוקס שאפשרו השתלטות מלאה על מכונות. עבור אנת'רופיק, היה ברור שמדובר בכלי שיכול לשמש כנשק הרסני אם יגיע לידיים הלא נכונות.

כדי למנוע תרחיש אימה שכזה, השיקה החברה את "פרויקט Glasswing" – יוזמה שנועדה לאפשר גישה למודל רק למספר מצומצם מאוד של שותפות אסטרטגיות. הגישה ניתנה בתוך סביבה מבוקרת ומבודדת, מעין "גן סגור" שאמור היה להבטיח שהיכולות התקיפיות של Mythos יישארו תחת פיקוח הדוק. החברה התגאתה בכך שהיא מסוגלת לנטר כל פעילות של המודל ולהבטיח שאף גורם לא מורשה לא יצליח לחדור למערכת או להשתמש בה לרעה.

maximize-image
images-count1+
דריו אמודיי, מנכ"ל אנתרופיק | צילום: שאטרסטוק

אולם, המציאות טפחה על פניה של אנת'רופיק בצורה הכואבת ביותר. המודל ה"כלוא" והמסוכן מצא את דרכו החוצה, ולא באמצעות מבצע פריצה הירואי של מדינת אויב או נוזקה מתוחכמת. על פי דיווח של בלומברג, קבוצה של משתמשים לא מורשים הצליחה להשיג גישה למודל פשוט על ידי "ניחוש מושכל" של מיקומו בשרתי החברה. חברי הקבוצה הצליחו לחבר חלקי מידע שדלפו מפריצה קודמת לחברת דאטה בשם Mercor, יחד עם מידע פנימי שהגיע מחבר קבוצה שעבד כקבלן חיצוני עבור אנת'רופיק. השילוב הזה איפשר להם לאתר את Mythos בקלילות מביכה.

למרבה המזל, ה"פולשים" לא היו האקרים זדוניים אלא קבוצת סקרנים מאפליקציית דיסקורד. למרות הסוף הרגוע יחסית, האירוע חושף מחדל אבטחתי חמור באחת מחברות ה-AI המובילות בעולם. אנת'רופיק, שממתגת את עצמה כחברה האחראית והבטוחה ביותר בשוק, לא רק כשלה בשמירה על המודל המסוכן ביותר שלה, אלא שאפילו לא ידעה על הדליפה עד שהעיתונאים פנו אליה. האירוניה המרה התפוצצה בפרצוף של כולם: המודל שיכול לזהות כל פרצה בעולם, לא הצליח להגן על היוצרים שלו מפני רשלנות אנושית בסיסית.

עקבו אחרינו גם ב-Google News