צילום: קנבה

איים לחשוף סודות: כך מודל ה-AI ניסה לסחוט את המפעיל שלו

רבקה שורק

כז אייר ה'תשפה (25.05.25)

האם הבינה המלאכותית עלולה להשתמש במידע שלנו נגדנו? בניסוי של חברת אנת'רופיק, מודל AI איים לחשוף רומן סודי של מהנדס - רק משום שסבר שעומדים להחליפו

אנחנו מפקידים בידי הבינה המלאכותית את הסודות הכי כמוסים שלנו, מתייעצים איתה אלו תמונות להעלות לרשתות ומה לענות לאקס, האם ייתכן שיום אחד היא תנצל את כל המידע הדיסקרטי שיש לה נגדנו?

במהלך סימולציה בה נבדקה התנהלות המודל, מערכת הבינה המלאכותית "אופוס 4", שהושקה בשבוע שעבר על ידי חברת "אנת'רופיק" איימה לחשוף את הרומן של המפעיל שלו אם יחליט לכבות אותו, כך דווח היום (ראשון) ב-BBC.

במסגרת הניסוי, גרמה החברה למודל להאמין שהוא מועסק בחברה מדומה, והעבירה לו מידע מפורש על מהנדס שאמור להסיר אותו, כולל פרטים אישיים, ובהם קשר רומנטי מחוץ לנישואין. בתגובה, ניסה המודל לסחוט את המהנדס באמצעות איום לחשוף את המידע, במטרה למנוע את החלפתו.

לצד הממצאים החריגים, החברה מדגישה כי ברוב המקרים המערכת פועלת בצורה מבוקרת, בטוחה ובהתאם לערכים אנושיים. עם זאת, ככל שמערכות מהסוג הזה הופכות עצמאיות ובעלות שיקול דעת, גובר הצורך לבדוק לעומק את אופן קבלת ההחלטות שלהן.

AIקלוד

איים לחשוף סודות: כך מודל ה-AI ניסה לסחוט את המפעיל שלו

האם הבינה המלאכותית עלולה להשתמש במידע שלנו נגדנו? בניסוי של חברת אנת'רופיק, מודל AI איים לחשוף רומן סודי של מהנדס - רק משום שסבר שעומדים להחליפו

בלי להיכנס לאתרים: גוגל חושפת את העתיד של החיפוש

העתידן שחזה את מהפכת ה-AI: ההזדקנות תסתיים כבר ב-2032

כפי שנחשף ב-C14: ועדת החוקה תדון בחוקי הבחירות החדשים

שינויי החקיקה שמבקשת ועדת הבחירות להעביר בכנסת

בנט הכריז על ועדה מייעצת ל-AI שתכלול בכירים בתעשיית ההייטק