DeepSeek V4 будет официально запущен, а цена API вырастет вдвое в часы пик

29 июня в электронном письме с напоминанием об обновлении, отправленном пользователям DeepSeek, было указано, что официальную версию DeepSeek V4 планируется официально запустить в середине июля, и вместе с ней появятся дополнительные оптимизации функций и улучшения производительности, а также механизм ценообразования в пиковые и минимальные периоды. Согласно электронному письму, часы пик с 9:00 до 12:00 и с 14:00 до 18:00 по пекинскому времени каждый день указаны как часы пик, а стоимость звонка в два раза превышает обычную цену. В то же время DeepSeek заявила, что уведомит пользователей по электронной почте за 24 часа до внесения соответствующих изменений.

«Постоянное снижение цен» перед «повышением цен»

Сообщается, что это не первый раз, когда DeepSeek корректирует цены в этом году. Официальный документ API показывает, что DeepSeek взимается за миллион токенов и взимается отдельно на основе попаданий в кеш, промахов в кеше и выходных токенов. В то же время сама серия DeepSeek V4 предъявляет высокие требования к вычислительной мощности.

24 апреля, когда DeepSeek выпустила предварительную версию V4, она заявила, что V4 Pro имеет 1,6 триллиона общих параметров и 49 миллиардов параметров активации, а V4 Flash имеет 284 миллиарда общих параметров и 13 миллиардов параметров активации. Оба поддерживают контекст в 1 миллион токенов.

Официальный документ также показывает, что предел параллелизма V4 Flash составляет 2500; в то время как высокопроизводительная модель V4 Pro имеет ограничение параллелизма 500, а ее эластичность предложения слабее, чем у Flash.

23 мая DeepSeek объявил, что преобразует предыдущую скидку 75% на V4 Pro в постоянную цену, а плата за API будет снижена с предыдущего максимума в 24 юаня/миллион токенов до максимума в 6 юаней/миллион токенов. На рынке тогда предполагали, что это может быть связано с увеличением поставок чипов Ascend 950 от Huawei, но DeepSeek на это не отреагировал.

После постоянного снижения цен текущая нормальная цена V4 Pro составляет 0,025 юаней/миллион токенов за вход в кэш, 3 юаня/миллион токенов за промах в кэше и 6 юаней/миллион токенов за вывод. Соответствующие цены на V4 Flash составляют 0,02 юаня, 1 юань и 2 юаня соответственно. В часы пик эти цены увеличатся вдвое, но все равно будут ниже, чем тогда, когда они были объявлены ранее.

Для обычных пользователей эта корректировка может не отражаться напрямую на изменениях в стоимости приложений чата; в основном пострадали разработчики, компании, занимающиеся приложениями искусственного интеллекта, и корпоративные клиенты, которые получают доступ к модели DeepSeek через API.

Если взять в качестве примера V4 Pro, то при расчете выходных токенов, если приложение AI потребляет 100 миллионов выходных токенов в день в часы пик, нормальная стоимость составляет около 600 юаней, а пиковая цена — около 1200 юаней; если он потребляет 1 миллиард токенов вывода в день, стоимость возрастает примерно с 6000 юаней до 12 000 юаней. Для высокочастотных приложений, таких как обслуживание клиентов, помощники по кодированию, офисные агенты и вопросы и ответы с расширенным поиском, удвоение цены может напрямую повлиять на валовую прибыль и стратегии звонков.

Речь не идет об отказе от дешевого маршрута.

В настоящее время введение DeepSeek пиковых и минимальных цен не означает отказ от маршрута с низкими ценами. Точнее, DeepSeek просто перераспределила вычислительные ресурсы по периодам использования, так что ее стратегия низких цен начала меняться от единой дешевизны к изысканной дешевизне.

Потому что, судя по ценам на токены, DeepSeek все еще находится в низкоценовом «действительно ароматном» диапазоне после введения пиковых и минимальных периодов и по-прежнему очень конкурентоспособен на международном рынке. Это также является причиной повышения цен на DeepSeek.

Согласно ценовой странице DeepSeek English API, выходная цена V4 Pro составляет 0,87 доллара США за миллион токенов, что составляет примерно 1,74 доллара США с учетом пикового удвоения. Напротив, на официальной странице цен OpenAI показано, что стандартная цена API GPT-5.5 составляет 5 долларов США за ввод, 0,5 доллара США за ввод кэша и 30 долларов США за вывод/миллион токенов; Обычная цена Claude Opus 4.8 от Anthropic составляет 5 долларов за вход и 25 долларов за выход/миллион токенов.

Если мы посмотрим только на выходные токены, цена высокопроизводительных моделей OpenAI и Anthropic по-прежнему примерно в 14-17 раз превышает пиковую цену DeepSeek V4 Pro.

С другой стороны, по мере того, как модель ценообразования крупных моделей на зарубежных рынках переходит от фиксированной подписки к выставлению счетов в токенах, затраты предприятий на использование начали резко расти. Многие зарубежные предприятия с ограниченным бюджетом все чаще обращаются к недорогим моделям, таким как DeepSeek.

Согласно предыдущим сообщениям, в качестве примера можно привести программное обеспечение для вызова такси Uber. После изменения модели ценообразования для крупных моделей годовой бюджет компании на ИИ был быстро израсходован всего за 4 месяца, в результате чего компании пришлось ограничить его использование руководителями. Ей посчастливилось стать «первой крупной компанией, которая перестала тратить деньги на искусственный интеллект».

Руководители Microsoft, Coinbase и других компаний также начали подчеркивать, что многие корпоративные задачи не всегда требуют самых дорогих и больших моделей. Эти изменения подтолкнули предприятия к более широкому использованию «многомодельной маршрутизации», то есть назначению простых задач дешевым моделям, а сложных задач моделям высокого класса.

Таким образом, данные OpenRouter показывают, что на модели с открытым исходным кодом приходится около 65% объема обработки токенов на его платформе. Среди них значительно возросло использование недорогих моделей в Китае, представленных DeepSeek, что интуитивно отражает то, что зарубежные пользователи вступили в эпоху «экономной экономии».