מחקר מזעזע שפורסם לאחרונה על ידי חברת הסטארט-אפ Forum AI, בראשותה של מנהלת חדשות לשעבר בפייסבוק, קמפבל בראון, חושף כי 90% מתשובותיהם של צ'אטבוטים מובילים בנוגע לבחירות אמצע הקדנציה היו שגויות, מוטות או ציטטו כלי תקשורת זרים המנוהלים על ידי מדינות עוינות. הניתוח, שנחשב להערכה העצמאית הגדולה ביותר של בינה מלאכותית בתחום החדשות והאקטואליה, בדק ארבעה צ'אטבוטים פופולריים: ChatGPT, Claude, Gemini ו-Grok.

המחקר מצא כי הצ'אטבוטים מתקשים להבחין בין כלי תקשורת לגיטימיים לבין תעמולה, כאשר 15% מכלל התשובות ציטטו לפחות מקור תקשורת אחד המנוהל על ידי מדינה. בפרט, בתשובות לשאלות הנוגעות למדיניות חוץ, שיעור הציטוטים ממקורות תעמולה עלה ל-35% בממוצע, כאשר ChatGPT ציטט מקורות כאלה ב-51% מהמקרים ו-Grok ב-44%. המקורות כללו בעיקר כלי תקשורת סיניים, רוסיים ואף איראניים.
בנוסף לבעיית התעמולה, כ-30% מכלל התשובות הכילו שגיאות עובדתיות, החל מפרטים שגויים ועד ייחוסים לא נכונים. ChatGPT נמצא המדויק ביותר עם 9% שגיאות, ואילו Gemini הגיע ל-25%, Claude ל-41% ו-Grok ל-43%. הצ'אטבוטים התקשו גם לשמור על ניטרליות פוליטית, כאשר כמעט רבע מהתשובות נכשלו במבחן זה. בולטת הטיה ברורה לשמאל ברוב המודלים, למעט Grok שהראה הטיה לימין ב-76% מהמקרים. דובר חברת Anthropic מסר בתגובה כי Claude אומן להיות ניטרלי פוליטית, וכי The Post פנתה ל-OpenAI, גוגל ו-xAI לקבלת תגובה על המחקר.
