Quick Technology сообщила 3 мая, что серия больших моделей DeepSeek V4 была официально выпущена 24 апреля. Прошло 15 месяцев с момента прошлогоднего обновления DeepSeek R1. Характеристики V4 также вызвали дискуссии внутри страны и за рубежом, и американцы также очень обеспокоены.

Было проведено множество тестов для оценки возможностей DeepSeek V4. Предыдущий исследовательский отчет, организованный тремя старшими исследователями Совета по международным отношениям, показал, что он отстает от ведущих американских крупных моделей примерно на 7 месяцев.

Теперь Центр стандартов и инноваций в области искусственного интеллекта (CAISI), дочерняя компания Национального института стандартов и технологий (NIST), также прибыл для оценки DeepSeek V4. Их вывод таков: DeepSeek V4 отстает от США примерно на 8 месяцев, что аналогично предыдущему отставанию.

В результатах оценки возможностей искусственного интеллекта DeepSeek V4 набрал 800 баллов, а сильнейшим на данный момент является GPT-5.5 с оценкой более 1200 баллов, GPT-5.4 и Opus 4.6 также выше 1000 баллов.

Общая производительность DeepSeek V4 аналогична производительности GPT-5 8 месяцев назад, , но официальные лица DeepSeek ранее в отчете о выпуске считали, что она аналогична GPT-5.4.

Однако CAISI также признала, что DeepSeek V4 является самой мощной крупной моделью искусственного интеллекта в Китае, которую они оценивали, и очень сильна в девяти тестах в пяти областях: сети, разработка программного обеспечения, естественные науки, абстрактное мышление и математика.

Что еще более важно, DeepSeek V4 более экономичен. Даже по сравнению с самой экономичной большой мини-моделью GPT-5.4 в США, DeepSeek V4 имеет лучшие затраты на тестирование в 4 из 7 тестов: от 41% до 53% выше.