Стартапы тратят большие средства на поиск «профессиональных хулиганов», которые разоблачат ненадежные воспоминания чат-ботов с искусственным интеллектом

Стартап-компания Memvid недавно опубликовала скандальное объявление о приеме на работу, открыто нанимая «профессионального ИИ-хулигана» для «истязания» основных чат-ботов в течение дня с зарплатой до 800 долларов, что вызвало дискуссию во внешнем мире, является ли его мотивация серьезным техническим испытанием или тщательно продуманным маркетинговым ходом.

Мемвид заявил, что основная цель этого набора — полностью раскрыть публике проблему «дефекта памяти», которая характерна для современных крупных моделей и чат-ботов. Компания считает, что, хотя большие языковые модели хорошо справляются с имитацией «содержательных интеллектуальных разговоров», они все же по сути являются обманчивыми программными продуктами с очень ограниченными возможностями памяти и часто «забывают» то, что пользователь только что сказал в одном и том же раунде разговора, заставляя пользователей повторять информацию неоднократно.

Согласно странице с вакансиями, эта однодневная почасовая работа оплачивается по цене 100 долларов в час при общем заработке 800 долларов и открыта для удаленных работников по всему миру. Новобранцы будут взаимодействовать с рядом основных чат-ботов с искусственным интеллектом почти «агрессивно» и с высокой интенсивностью, постоянно требуя от них запоминания различной информации. В ходе процесса система будет фиксировать такие ситуации, как неудачные разговоры, забытый контекст и несоответствия. Помимо того, что кандидаты сами делают подробные записи, Memvid также будет записывать весь эксперимент с помощью записи экрана или камеры для последующего анализа.

Интересно, что эта вакансия не требует от кандидатов наличия какого-либо технического образования в области искусственного интеллекта или «опыта издевательств», но в условиях четко указано: кандидаты должны представить подробное личное заявление, объясняющее их прошлый негативный опыт при использовании технологических продуктов, и должны иметь четкое и сильное недовольство текущей технологией искусственного интеллекта. Мохамед Омар, соучредитель и генеральный директор компании, заявил, что они хотели найти «кто-то, кто действительно ненавидит ИИ», чтобы выполнить задачу.

Омар отметил в интервью, что серьезные проблемы с памятью, с которыми сегодня сталкиваются чат-боты, тесно связаны с «ненадежностью» решений памяти ИИ раннего поколения. По его мнению, способность постоянно сохранять пользовательскую информацию и поддерживать контекстную связность в долгих разговорах — это святой Грааль «по-настоящему полезного чат-бота». Так называемый феномен «галлюцинации» во многом является прямым результатом плохих механизмов памяти больших моделей и привычек использования.

Memvid пользуется этой возможностью, чтобы продвигать свое собственное решение уровня памяти AI. Компания утверждает, что это файловый самоулучшающийся компонент памяти, который может обеспечивать постоянный контекст во время разговоров для крупных моделей и чат-ботов, тем самым повышая точность ответа, уменьшая задержку и улучшая использование инфраструктуры без ущерба для производительности. Этот уровень памяти можно использовать в качестве основной возможности собственного чат-бота Memvid Kora или интегрировать в другие продукты искусственного интеллекта в виде инструментов разработчика.

Поскольку большие модели широко используются в реальных сценариях приложений, проблема памяти ИИ становится все более заметной: перед лицом огромных хранилищ данных и сложных бизнес-требований чат-боты часто сталкиваются с «фрагментами», забывая прошлые события и даже придумывая случайные вещи во время долгосрочных и многораундовых взаимодействий, и пользовательский опыт постоянно ухудшается. В этом контексте набор сотрудников Memvid для «запугивания ИИ» является одновременно творческой рекламой собственных продуктов и тревожным звонком, чтобы подтвердить текущее состояние отрасли, напоминая общественности, что нынешний ИИ все еще далек от того, чтобы быть «по-настоящему надежным партнером в разговоре».

Набор на эту должность будет продолжаться несколько недель, и будет выбран только один кандидат, сказал Мемвид. Компания надеется получить достаточно негативных случаев посредством этой интенсивной «истязания» основных чат-ботов, которые не только предоставят материалы для демонстрации ее собственных продуктов, но и станут яркой отправной точкой для социальных дискуссий о безопасности и надежности ИИ.