Последнее исследование BBC показало, что чат-боты с искусственным интеллектом по-прежнему имеют значительные недостатки в точности новостных репортажей: почти половина создаваемого контента содержит ошибки. Согласно аналитическому отчету, совместно опубликованному BBC и 22 другими европейскими общественными медиа-организациями, в 18 странах и 14 языковых средах, когда чат-боты с искусственным интеллектом получали доступ к контенту новостных организаций и отвечали на соответствующие вопросы, около 45% их ответов содержали ошибки.
Эти ошибки включают не только неточные предложения и неправильные цитаты, но также такие проблемы, как устаревшая информация, неправильные цитаты и несоответствия источников. В отчете отмечается, что чат-боты часто предоставляют ссылки, которые не соответствуют фактическим цитируемым источникам, и даже при точном цитировании материала не могут отличить факты от мнений, сатиру от законных новостей.
Крупнейшие технологические компании, в том числе OpenAI, Google, Microsoft и др., активно продвигают генеративные чат-боты с искусственным интеллектом и глубоко интегрируют их в интернет-платформы, чтобы помочь пользователям автоматически получать и анализировать информацию. Хотя разработчики продолжают вкладывать много ресурсов в уменьшение явления «галлюцинаций» (то есть изготовления контента с помощью ИИ), отчеты показывают, что эту проблему все еще трудно полностью решить в краткосрочной перспективе.
В реальных тестах многие основные инструменты искусственного интеллекта, такие как ChatGPT, Copilot и Gemini, имели значительные ошибки. Например, они ошибочно утверждают, что Папа Франциск все еще находится у власти, хотя на самом деле его сменил Лев XIV. Некоторые ИИ даже правильно сообщили дату смерти Франциска, но все равно назвали его нынешним Папой. Кроме того, имеется устаревшая и неверная информация о соответствующих руководящих должностях.

В докладе также показано, что эти проблемы не ограничиваются одним регионом или языком, а широко распространены по всему миру. Среди них Gemini от Google является наименее точным: до 72% его ответов содержат существенные ошибки источника. Ранее OpenAI объясняла такие ошибки тем, что ранняя версия обучалась только до сентября 2021 года и не могла получать информацию из Интернета в режиме реального времени. Однако оно больше не применимо. Следовательно, проблема, скорее всего, связана с самим алгоритмом, и ее трудно устранить путем обновления данных.
Хотя доля серьезных ошибок снизилась с 51% до 37% по сравнению с отдельным тестом BBC в феврале этого года, Gemini по-прежнему отстает от других продуктов. Несмотря на плохие результаты, исследователи обнаружили, что британская общественность продемонстрировала высокую степень доверия к обобщению новостей ИИ: более трети взрослых британцев и почти половина людей в возрасте до 35 лет считали, что ИИ может точно суммировать содержание новостей. 42% опрошенных заявили, что, когда ИИ искажает исходный контент новостей, он также ставит под сомнение надежность самой новостной организации или снижает доверие к ней. Эксперты предупреждают, что растущая популярность инструментов генеративного искусственного интеллекта может серьезно подорвать репутацию и авторитет основных новостных организаций, если такие проблемы сохранятся.
