Днем 29 мая многие пользователи сети обнаружили, что DeepSeek имеет ограничение на количество раз, когда его можно перегенерировать и изменить. После изменения или регенерации несколько раз подряд на странице появится сообщение о том, что достигнут верхний предел. Некоторые пользователи сети сообщили, что при обычном разговоре верхний предел будет достигнут после 3-6 регенераций; в экспертном режиме может быть только 3 возможности. Верхний предел времени ввода изменений обычно составляет 6 раз.

На данный момент DeepSeek не сделал официального заявления и не обнародовал фиксированную таблицу квот, но этот вопрос вызвал бурные дискуссии в сообществе — ведь у DeepSeek большое количество лояльных пользователей, включая меня. Мы периодически сталкиваемся с перегруженностью серверов и сбоями страниц, что понятно всем, но мы не можем просто так добавлять ограничения молча, что вызывает у людей панику.
API вообще не затронуто, так что скорее всего проблема в инфраструктуре, знакомый рецепт.

01
Временное ограничение тока при нехватке вычислительной мощности?
Что касается этого ограничения, в «полуофициальном аккаунте» Байцяна на Сяохуншу говорится: «Не паникуйте, это временно».

Согласно ему, «изменить сообщение» и «перегенерировать» были внезапно ограничены. Дело не в том, что DeepSeek проводил так называемую «негативную оптимизацию», просто этоВременные меры, принятые после того, как давление вычислительной мощности слишком велико.
Поскольку число пользователей DeepSeek в этот период быстро росло, особенно начиная со второй половины дня 29 мая, давление запросов со стороны приложения было очевидным. Чтобы расставить приоритеты и обеспечить возможность нормального использования самых простых текстовых разговоров, команда может сначала ограничить только высокочастотные операции, такие как «изменить сообщения» и «перегенерировать».
Хотя в пользовательском интерфейсе «перегенерировать» — это всего лишь щелчок кнопки, а «изменить сообщение» — это всего лишь вопрос изменения исходного вопроса. Но для сервера эти две вещи — не простое обновление, а новый запрос на вывод. Каждый раз, когда пользователь нажимает кнопку регенерации, модель должна повторно обработать контекст и сгенерировать ответ. То же самое справедливо и для изменения сообщения. Пока исходный вопрос меняется, модели необходимо снова ответить на него на основе новых входных данных.
Следовательно, когда большое количество пользователей одновременно нажимают несколько раз и рассматривают «Регенерировать» как кнопку бесконечного вытягивания карты, эти запросы окажутся тяжелым бременем для сервера.
Этот вопрос можно рассматривать вместе с некоторыми недавними изменениями в DeepSeek. Например, причиной загрузки и удаления файлов в экспертном режиме, отключения функции интеллектуального поиска и периодической «занятости сервера» на самом деле является нехватка вычислительных ресурсов.Общее давление на сервис стало настолько высоким, что приходится идти на компромиссы.

DeepSeek настолько прост в использовании, что базовая инфраструктура должна поддерживать его.
Что касается ситуации, когда «изменить сообщение» или «перегенерировать» достигают верхнего предела, Байцян советует не нажимать непрерывно и быстро. Вы можете сначала остановиться и подождать 15–30 минут, прежде чем повторить попытку. По данным аккаунта, в большинстве случаев ограничение автоматически восстанавливается после ожидания; если вы нажмете несколько раз и быстро, это может быть распознано системой как аномально высокочастотный запрос, в результате чего время ограничения увеличится.
Бай Цян также упомянул, что новые карты суперузлов Ascend от Huawei уже развернуты и, как ожидается, появятся в сети во второй половине года. К тому времени вычислительные мощности будут существенно расширены, и эти временные ограничения, скорее всего, будут сняты.
Однако DeepSeek пока не сделал официального заявления по этому поводу. Включая количество лимитов, время восстановления и конкретные изменения после расширения вычислительных мощностей во второй половине года, нам все еще нужно дождаться дальнейшего официального подтверждения.
02
DeepSeek — не единичный случай
На самом деле, DeepSeek — не первая компания в области искусственного интеллекта, которая сделала это.
Когда вычислительная мощность продуктов крупных моделей ограничена, количество пользователей резко возрастает или нагрузка слишком высока в периоды пиковой нагрузки, общепринятой практикой является ограничение текущего потока, понижение версии, постановка в очередь или отдельное ограничение некоторых функций с высоким потреблением.
ChatGPT всегда имел ограничение на количество сообщений, и даже платные пользователи могут столкнуться с ограничениями на использование в периоды высокого спроса. После того, как бесплатные пользователи достигнут квоты расширенной модели, они также будут переключены на более легкую модель, чтобы продолжить ее использование.
Его можно понимать как своего рода «понижение сервиса», что не означает, что его нельзя использовать, а то, что каждый не может иметь неограниченное использование самых дорогих и ресурсоемких возможностей.

Подобно Claude, Anthropic устанавливает бюджеты использования для разных пользователей, а высокочастотные сценарии, такие как Claude Code и API, также корректируют верхний предел в соответствии с изменениями емкости. Когда вычислительная мощность достаточна, квота может быть увеличена; когда давление спроса увеличится, ограничения станут более очевидными.
6 мая Anthropic также выпустила специальный документ, в котором говорится, что благодаря новому сотрудничеству в области вычислительных мощностей и увеличению мощности компания увеличила лимит использования Claude Code и Claude API. В свою очередь, это также показывает, чтоЛимит использования напрямую связан с мощностью вычислительной мощности. Он будет ужесточен, когда вычислительная мощность ограничена, и будет ослаблен после увеличения вычислительной мощности.

Однако теперь Anthropic установила более подробные ограничения на использование для различных квот подписки, а сценарии с высоким потреблением, такие как Claude Code, становятся ближе к логике измерения и начисления токенов.
Продукты для создания изображений и видео более типичны. Функции генерации изображений Sora и Gemini, а также другие видеоинструменты с искусственным интеллектом пережили периоды сокращения количества поколений, увеличения времени ожидания и сокращения бесплатных квот при резком росте спроса.
Можно сказать, что «каждый вывод имеет свою цену» стал неизбежной реальностью для продуктов искусственного интеллекта.
Некоторое время назад зарядка мешков с фасолью вызвала дискуссию. «Дубао, дорогой и сложный в использовании» однажды стал популярным поиском на Weibo. На этот раз это отличается от ограниченных функций DeepSeek, но логика реакции пользователей та же: все привыкли к тому, что продукты искусственного интеллекта дешевы и просты в использовании. Как только платформа начнет взимать плату или начнет ограничивать определенные функции, настроения пользователей легко восстановятся.
На самом деле это очень распространенная практика для компаний, занимающихся искусственным интеллектом, — делать базовые возможности бесплатными, начинать взимать плату за сложные возможности, устанавливать квоты на дорогостоящие функции и временно ограничивать поток в периоды пиковой нагрузки.
DeepSeek ограничивает количество «сообщений о регенерации» и «модификации», что не является чем-то необычным для всей индустрии искусственного интеллекта. Он ограничивает не вход в чат или саму модель, а только те операции, на которые пользователи легко могут часто нажимать, но каждый щелчок снова будет потреблять ресурсы рассуждения.
Поскольку базовый диалог должен быть сохранен в максимально возможной степени, это является основой для того, чтобы пользователи могли использовать продукт; однако такие функции, как регенерация, повторные модификации, загрузка файлов, поиск в Интернете, длинный контекст и мультимодальная генерация, с большей вероятностью будут ограничены или понижены, когда нагрузка высока.
Я чувствую, что в центре внимания этого спора не «сколько ограничить», а «как ограничить».
Если бы чиновник мог объяснить ранее, что это временное ограничение тока, сколько времени потребуется для возобновления и какие операции затронуты, пользователи, скорее всего, отнеслись бы к этому с большим пониманием.Но если он вдруг без анонса станет недоступен, конечно все сразу задумаются, не уменьшаются ли функции и не будет ли взиматься плата в будущем.
Когда продукты искусственного интеллекта превратятся из инструментов раннего внедрения в инструменты повседневного использования, пользователи будут все больше заботиться о стабильности и прозрачности. Сами ограничения понятны, но лучше не сообщать о них пользователям в первый раз во всплывающем окне.
DeepSeek должен знать, что если количество использований увеличивается настолько, что его нужно ограничить, это также означает, что вас ждет много пользователей.
Даже если это просто одобрение.