Новое исследование: Чат-боты с искусственным интеллектом более креативны, чем среднестатистические люди

Недавнее исследование, опубликованное в журнале Scientific Reports, предполагает, что чат-боты с искусственным интеллектом большой языковой модели (LLM) могут превосходить обычных людей в творческих задачах, таких как мозговой штурм альтернативного использования обычных предметов, что является отражением дивергентного мышления. Тем не менее, люди, набравшие наибольшее количество баллов по этим задачам, все же превзошли результаты самых эффективных чат-ботов.

Дивергентное мышление — это мыслительный процесс, часто связанный с творчеством, в котором особое внимание уделяется генерированию множества различных идей или решений конкретной задачи.

Обычно он оценивается с помощью задачи альтернативного использования (AUT), в которой участников просят придумать как можно больше альтернативных вариантов использования предметов повседневного обихода за короткий период времени. Ответы были разделены на четыре категории: беглость, гибкость, оригинальность и проработанность.

Мика Койвисто и Симоне Грассини сравнили ответы 256 участников-людей с ответами трех чат-ботов искусственного интеллекта (ChatGPT3, ChatGPT4 и Copy.Ai) и их ответами AUT на четыре объекта: веревку, коробку, карандаш и свечу. Авторы оценивали оригинальность ответов по рейтингу семантической дистанции (насколько близко ответ соотносится с оригинальным использованием объекта) и креативности.

Семантическое расстояние количественно оценивается с помощью вычислительных методов по шкале от 0 до 2, в то время как люди-оценщики, не обращая внимания на инициатора ответа, субъективно оценивают креативность по шкале от 1 до 5. В среднем чат-боты генерировали ответы, которые оценивались значительно выше, чем человеческие ответы, по семантической дистанции (0,95 против 0,91) и креативности (2,91 против 2,47).

Реакция человека имела более широкий диапазон по обоим показателям: самые низкие оценки были намного ниже, чем ответы ИИ, но самые высокие оценки, как правило, были выше. Лучший ответ человека превзошел лучший ответ каждого чат-бота в семи из восьми рейтинговых категорий.

Эти результаты показывают, что чат-боты с искусственным интеллектом теперь могут генерировать идеи не хуже людей. Однако авторы отмечают, что они учитывали только выполнение одной задачи, имеющей отношение к оценке креативности. Авторы предполагают, что будущие исследования могут выяснить, как интегрировать искусственный интеллект в творческий процесс для улучшения производительности человека.