SemiAnalysis, отраслевая аналитическая организация, недавно провела фактическое тестирование многоуровневых планов подписки OpenAI и Anthropic. Результаты показали, что за доступной ежемесячной платой скрывается огромный разрыв в субсидиях на вычислительные мощности. Агентство приобрело различные планы подписки у двух компаний и продолжало выполнять сложные задачи, такие как долгосрочное программирование и «интеллектуальные агенты», пока не был достигнут еженедельный лимит использования, а затем рассчитало теоретические затраты, соответствующие этим использованиям, на основе общедоступных цен на API.

HKeyVeRXAAAGLnY.jpg

Результаты расчетов показывают, что если подписка OpenAI «ChatGPT Pro 20x» стоимостью 200 долларов США будет полностью использована, соответствующий счет за API может достичь максимальной суммы примерно 14 000 долларов США. Решение Anthropic «Claude Max 20x» по той же цене может приблизиться к теоретической стоимости токена около 8000 долларов США в экстремальных условиях использования. Это означает, что небольшого количества активных пользователей достаточно, чтобы съесть изначально ограниченную прибыль по модели подписки.

Согласно анализу SemiAnaанализа, это одна из причин, почему крупные модельные компании уделяют особое внимание «утилизации». Что касается Anthropic, то на таких уровнях, как Claude Pro и Claude Max 5x, компания может примерно выйти на уровень безубыточности, когда фактическое использование пользователей достигнет примерно 20%. Для сравнения, прибыль OpenAI еще меньше: при подписках ChatGPT Plus и ChatGPT Pro 5x, как только загрузка превышает примерно 11,4%, компания начинает терять деньги на этом пользователе.

В случае более дорогих топ-планов экономическая структура еще больше ужесточается. В отчете отмечается, что валовая прибыль Anthropic от подписок высокого класса была близка к нулю, когда уровень использования достигал около 10%, в то время как OpenAI попадал в отрицательный диапазон валовой прибыли, когда уровень использования составлял около 5,7%. Другими словами, пользователям не обязательно достигать чрезвычайно высокой частоты использования этих подписок, чтобы перейти от «прибыльных продуктов» к «убыточным продуктам».

В этом контексте вопрос о том, как корректировать цены или ограничивать доступ, стал для производителей сложной проблемой. Модель подписки с фиксированной ежемесячной платой является ключевым фактором быстрой популярности таких продуктов, как ChatGPT и Claude. После ужесточения квот или повышения пороговых значений темпы роста числа пользователей могут замедлиться. В нынешней крупномасштабной модельной «гонке вооружений» возможности и доступность моделей по-прежнему являются одними из наиболее важных конкурентных фишек, что усложняет компаниям возможность легко корректировать свои стратегии.

С другой стороны, изменения в том, как на самом деле используется ИИ, также приводят к увеличению затрат. В отчете отмечается, что потребление токенов в новых рабочих процессах, представленных многоэтапными «агентскими» системами, которые автономно вызывают инструменты, может в тысячу раз превышать потребление традиционных однораундных диалогов. Такая интенсивная модель звонков заставила некоторые крупные предприятия пересмотреть стратегии внутренней открытости и контроля затрат на инструменты ИИ.

По имеющимся данным, такие компании, как Microsoft, Meta и Amazon, свернули свою прежнюю практику поощрения сотрудников к проведению крупномасштабных испытаний и внутренних рекламных акций из-за быстрого роста внутренних счетов. В одном широко разрекламированном случае компания сожгла 500 миллионов долларов на услугах Anthropic всего за один месяц, не установив никаких ограничений на использование Claude сотрудниками, что напрямую вызвало вмешательство по управлению чрезвычайными ситуациями.

HKyDGuQa4AAi4ow.png

Под давлением стоимости и фактического спроса все больше и больше предприятий начинают применять более совершенные модели стратегий маршрутизации. Один из подходов состоит в том, чтобы передать сложные, ценные проблемы дорогостоящим «пограничным моделям» (frontier model), одновременно делегируя рутинную офисную работу, основные задачи вопросов и ответов более дешевым моделям. Распределяя таким образом задачи, некоторые компании могут сократить общие затраты на ИИ на целых 95%, цитирует исследование The Wall Street Journal. Вишал Мисра, заместитель декана Колумбийского университета, отметил, что компаниям не всегда нужны большие модели высшего уровня, которые «понимают квантовую гравитацию». Многих моделей с открытым исходным кодом достаточно для повседневных нужд, что также приведет к сокращению места премиум-класса дорогих закрытых моделей.

Некоторые стартапы в области искусственного интеллекта совершили более радикальную миграцию. Фло Кривелло, основатель и генеральный директор стартапа Lindy, занимающегося искусственным интеллектом, заявил, что компания переключила 100% своего трафика на DeepSeek V4, полностью отойдя от модели Anthropic. По их оценке, DeepSeek V4 был сопоставим по возможностям с Claude Sonnet при гораздо меньшей стоимости, и этот переход, как сообщается, сэкономил компании миллионы долларов.

Другие предпочитают создавать свои собственные системы на основе моделей с открытым исходным кодом, объединяя внутренние данные с собственной инфраструктурой в обмен на более контролируемую долгосрочную структуру затрат. Хотя этот путь требует более высоких первоначальных инвестиций, он помогает снизить зависимость от сторонних поставщиков облачных ИИ и позволяет предприятиям более детально контролировать затраты на логические выводы, безопасность данных и оптимизацию производительности. В конкретных вертикальных сценариях тщательно настроенные внутренние модели могут даже превзойти передовые модели общего назначения.

В среднесрочной и долгосрочной перспективе отрасль обычно ожидает, что некоторые затраты будут постепенно снижаться по мере расширения инфраструктуры, развития аппаратного обеспечения и итерации модели. SemiAnaанализ прогнозирует, что с уровнем возможностей среднего и высокого класса, представленным нынешним Opus 4.8, ожидается, что в будущем он будет рентабельно предоставляться по цене около 20 долларов США в месяц за счет более зрелых технологий и более эффективных вычислительных мощностей. Но это суждение не применимо к самым передовым моделям высшего уровня, эксплуатационные расходы которых останутся высокими в обозримом будущем и которые, скорее всего, будут взиматься через биллинг API, многоуровневую разблокировку функций и т. д., а не просто упакованы в единый план подписки для масс.

До тех пор поставщикам услуг ИИ все еще необходимо найти трудный баланс между двумя направлениями: с одной стороны, пользователи хотят получить максимально мощные возможности ИИ за низкую и предсказуемую ежемесячную плату; с другой стороны, базовые вычислительные мощности и инфраструктура, поддерживающие эти возможности, по-прежнему дороги и очень чувствительны к интенсивности использования. Генеральный директор OpenAI Сэм Альтман также публично признал, что стоимость токенов становится все более серьезной проблемой, и компания усердно работает над оптимизацией продуктов и архитектуры, чтобы позволить пользователям получать «большую выгоду с меньшими затратами» при использовании ChatGPT.