На этом Весеннем фестивале весь Интернет ждет, когда DeepSeek выпустит последнюю большую модель DeepSeek V4, но теперь кажется, что большая версия может не быть выпущена во время Весеннего фестиваля. Сегодня DeepSeek незаметно обновил новую версию, в которой есть много особенностей. Согласно собственному представлению DeepSeek, это обновление в основном улучшает возможности контекста, достигнув 1M, в то время как предыдущая серия DeepSee V3 составляла 128K.
С контекстом 1M DeepSeek может обрабатывать чрезвычайно длинный текст размером с трилогию «Задача трех тел».Это было подтверждено реальными тестами многих пользователей сети.

Другие возможности были доступны и раньше, и DeepSeek не предоставил более подробной информации.
Стоит отметить, что DeepSeek после ответа на этот вопрос добавил специальный абзац, подчеркнув, что это последняя модель DeepSeek, без конкретного подназвания, а не V3 или R1, как бы намеренно подчеркивая отличие этой модели, а не для того, чтобы заставить людей думать, что это версия V4 Preview.

Однако, судя по отзывам пользователей сети, это небольшое обновление DeepSeek на самом деле значительно улучшило его возможности. Известный блоггер по тестированию крупных моделей @karminski-dentist выпустил быстрый тест, который в основном тестирует проект по тестированию зубной пасты слона с точки зрения программирования.
Вывод таков: видимая эстетика, моделирование, физическое моделирование и производительность кода были улучшены, и есть даже небольшие сюрпризы.Это SOTA, чем любая другая версия, выпущенная ранее.То есть текущая оптимальная большая модель (конечно, в основном относится к версии DS).
Пока неясно, является ли новая модель DeepSeek полной, поскольку некоторые пользователи сети проверяли вопрос о том, идти или ехать на автомойку на расстоянии 50 метров, что было очень популярно в эти два дня. Новая модель DeepSeek дала разные ответы. Кто-то сказал, что это правильно, кто-то сказал, что это невозможно.