Генерация изображений теперь стала ключевой функцией, способствующей развитию приложений искусственного интеллекта

Последний анализ данных приложений показывает, что в 2026 году главный герой, который действительно может стимулировать рост загрузок мобильных приложений AI, сместится от самих более «умных» крупных моделей к визуальным функциям с генеративными изображениями в качестве ядра. Согласно статистике Appfigures, обновления версий, в которых модели изображений используются в качестве аргумента в пользу продажи, приносят примерно в 6,5 раз больше новых загрузок, чем «обычные обновления», направленные на улучшение языковых или логических способностей.

Это изменение знаменует собой явный сдвиг в фокусе волны ИИ. На первых порах пользователями побуждало попробовать приложения искусственного интеллекта главным образом итерацию моделей диалога и улучшение методов взаимодействия, таких как голос. Эти функции по-прежнему важны и сегодня, но они уже не способны существенно стимулировать интерес пользователей за короткий период времени, как это делалось в прошлом. Напротив, функции, которые напрямую создают визуальный контент, которым можно поделиться, с большей вероятностью привлекут внимание в социальных сетях и магазинах приложений.

Последние изменения в продуктах нескольких головных платформ хорошо подтверждают эту тенденцию. После того, как приложение Google Gemini запустило имиджевую модель Nano Banana, количество установок значительно подскочило; в течение 28 дней после запуска модели образа Gemini 2.5 Flash было зарегистрировано более 22 миллионов новых загрузок, причем темпы роста были примерно в четыре раза выше, чем предыдущий средний показатель за тот же период времени. Эта серия обновлений показывает, что даже если изменения в самой базовой модели не будут потрясающими, пока есть новый игровой процесс на «видимой» стороне изображения, этого будет достаточно, чтобы изменить кривую загрузки в краткосрочной перспективе.

ChatGPT от OpenAI продемонстрировал аналогичный рост после интеграции возможностей генерации изображений GPT-4o. За первые 28 дней после запуска новой функции приложение установили более 12 миллионов человек. Сравнительные данные Appfigures показывают, что этот пик загрузки примерно в 4,5 раза превышает увеличение, вызванное предыдущими обновлениями моделей, такими как GPT-4o, GPT-4.5 и GPT-5, что еще раз подтверждает, что для большинства новых пользователей «видимые» функции изображения являются более инновационными, чем улучшения производительности текста, которые трудно воспринимать интуитивно.

Эта модель роста визуального контента не ограничивается статичными изображениями. Продукт искусственного интеллекта Meta, Vibes, который фокусируется на коротких видеороликах, созданных искусственным интеллектом, принес около 2,6 миллиона дополнительных загрузок приложения за первый месяц с момента его запуска в сентябре 2025 года. Хотя по форме он делает упор на видео, по сути это по-прежнему визуальный инструмент искусственного интеллекта, который стремится к «быстрому производству и простому обмену». Он и функция генерации изображений указывают в одном направлении: использование более прямой визуальной обратной связи, чтобы сократить путь пользователя от любопытства к распространению информации.

Однако рост числа загрузок не означает автоматически увеличение доходов. Данные также выявили очевидный разрыв между «ростом и реализацией». Если взять в качестве примера Gemini, то хотя Nano Banana добилась высоких показателей новой установки в течение 28 дней после ее выпуска, ее предполагаемые расходы со стороны потребителей за тот же период составили всего около 181 000 долларов США. Vibes от Meta столь же впечатляет в увеличении количества установленных устройств, но признаков соответствующего роста доходов мало. Это показывает, что для большинства продуктов функция изображения в настоящее время больше похожа на «инструмент привлечения клиентов», чем на механизм прямой монетизации.

На данный момент ChatGPT является одним из немногих исключений, которые «снимают проклятие». Его модель изображения GPT‑4o не только привлекла большое количество новых пользователей, но и значительно увеличила платные конверсии: в течение 28 дней после запуска новой функции предполагаемые расходы пользователей приложения были примерно на 70 миллионов долларов выше базового уровня. Этот набор данных показывает, что имиджевая функция действительно имеет потенциал для одновременного выполнения двойных задач: «привлечения новых пользователей» и «монетизации», но только если ее позиционирование и дизайн оплаты в структуре продукта достаточно ясны, чтобы пользователи были готовы платить за нее, а не просто рассматривать ее как бесплатный «игрушечный фильтр».

Не все модные продукты искусственного интеллекта полагаются на возможности визуализации для стимулирования роста. Модель R1, выпущенная DeepSeek в январе 2025 года, без заметных возможностей изображения или видео, также получила около 28 миллионов загрузок за короткий период времени. Разница в том, что эта волна роста вызвана скорее вниманием отрасли и тематическими эффектами, особенно широкими дискуссиями, вызванными недорогим маршрутом обучения и соответствующими техническими путями в технологических кругах, а не конкретным типом генеративных визуальных характеристик.

Тем не менее, судя по текущим общим данным, тенденция достаточно ясна: в мобильных сценариях функции визуального ИИ становятся первой точкой входа для большого количества пользователей для доступа к ИИ-приложению. Для обычных пользователей изображения и короткие видеоролики, которые можно быстро создать и сразу же опубликовать, зачастую более привлекательны, чем более абстрактные «улучшение вывода» и «обновление модели». Эволюция возможностей базовой модели по-прежнему важна, но она все чаще «скрывается» на заднем плане. То, что в конечном итоге определяет, готовы ли пользователи загружать, пробовать или даже рекомендовать приложение, часто является явными и легко распространяемыми изображениями и видео.