Сегодня 09 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Сбербанке началось массовое сокращение IT-специалистов, которое объясняют внедрением ИИ 2 ч.
ИИ-браузер Dia стал доступен всем пользователям macOS 2 ч.
Южноафриканский суд поддержал решение арбитража РФ о взыскании с Google 10 млрд рублей 2 ч.
Создатели Hyper Light Drifter и Solar Ash свернут разработку Hyper Light Breaker спустя девять месяцев в раннем доступе 3 ч.
Microsoft заключила партнёрское соглашение с Гарвардом — Copilot прокачают в области медицины 4 ч.
Уволенные Microsoft ветераны The Elder Scrolls Online основали Sackbird Studios, чтобы создавать «незабываемые» игры без оглядки на инвесторов 4 ч.
Осовремененная версия популярного квеста Syberia получила новый сюжетный трейлер 4 ч.
Salesforce не будет платить выкуп хакерам, укравшим из её базы данные 39 клиентов, включая Toyota и FedEx 4 ч.
Netflix анонсировала «совершенно новый способ игры», который выведет веселье на новый уровень — видеоигры для телевизоров 6 ч.
Discord сообщил об утечке удостоверений личности 70 000 пользователей 11 ч.
Уровень проникновения архитектуры RISC-V на рынке достиг 25 % — намного быстрее, чем все ожидали 52 мин.
«Мегафон» запустил в Санкт‑Петербурге новый ЦОД на импортозамещённом оборудовании 56 мин.
Круговая порука: всё больше аналитиков опасаются формирования «пузыря» на рынке ИИ 2 ч.
МТС полностью прекратит обслуживание сетей 3G в 2027 году 2 ч.
Китай наладил выпуск детских игрушек с ИИ и готовится к мировой экспансии 2 ч.
И целого триллиона мало: OpenAI заявляет, что готовит новые мегасделки для расширения инфраструктуры ИИ 2 ч.
Совокупная пропускная способность международных интернет-соединений достигла 1835 Тбит/с 3 ч.
Китай ограничил экспорт своих чипов и полупроводникового оборудования — ради «национальной безопасности» 4 ч.
Блоки питания MSI MAG GLS 80 Plus Gold получили платиновый рейтинг Cybnetics 4 ч.
AMD обгонит Nvidia по техпроцессам: в ускорителях Instinct MI450 будут использоваться 2-нм чипы, а в Rubin — нет 4 ч.