accessibility-icon
share-icon
צילום: קנבה
צילום: קנבה

איים לחשוף סודות: כך מודל ה-AI ניסה לסחוט את המפעיל שלו

רבקה שורק

רבקה שורק

כז אייר ה'תשפה (25.05.25)

3

0

like

0

dislike

האם הבינה המלאכותית עלולה להשתמש במידע שלנו נגדנו? בניסוי של חברת אנת'רופיק, מודל AI איים לחשוף רומן סודי של מהנדס - רק משום שסבר שעומדים להחליפו


אנחנו מפקידים בידי הבינה המלאכותית את הסודות הכי כמוסים שלנו, מתייעצים איתה אלו תמונות להעלות לרשתות ומה לענות לאקס, האם ייתכן שיום אחד היא תנצל את כל המידע הדיסקרטי שיש לה נגדנו?

במהלך סימולציה בה נבדקה התנהלות המודל, מערכת הבינה המלאכותית "אופוס 4", שהושקה בשבוע שעבר על ידי חברת "אנת'רופיק" איימה לחשוף את הרומן של המפעיל שלו אם יחליט לכבות אותו, כך דווח היום (ראשון) ב-BBC.

maximize-image
בינה מלאכותית | קרדיט: shutterstock

במסגרת הניסוי, גרמה החברה למודל להאמין שהוא מועסק בחברה מדומה, והעבירה לו מידע מפורש על מהנדס שאמור להסיר אותו, כולל פרטים אישיים, ובהם קשר רומנטי מחוץ לנישואין. בתגובה, ניסה המודל לסחוט את המהנדס באמצעות איום לחשוף את המידע, במטרה למנוע את החלפתו.

לצד הממצאים החריגים, החברה מדגישה כי ברוב המקרים המערכת פועלת בצורה מבוקרת, בטוחה ובהתאם לערכים אנושיים. עם זאת, ככל שמערכות מהסוג הזה הופכות עצמאיות ובעלות שיקול דעת, גובר הצורך לבדוק לעומק את אופן קבלת ההחלטות שלהן.

עקבו אחרינו גם ב-Google News