Китайская академия информационных и коммуникационных технологий объявила сегодня, что она официально запустила тест адаптации локализации DeepSeek V4, чтобы способствовать углубленному сотрудничеству между моделью и отечественным программным и аппаратным обеспечением, а также ускорить промышленное внедрение.Этот тест проводился на базе Ключевой лаборатории Министерства промышленности и информационных технологий и системы эталонного тестирования AISHPerf, охватывающей полный набор программных и аппаратных продуктов искусственного интеллекта, таких как чипы, серверы, многофункциональные машины, кластеры, цепочки инструментов разработки и интеллектуальные вычислительные платформы, с упором на процессы вывода и тонкой настройки всей серии моделей DeepSeek V4.

Оценка оценивается по пяти измерениям: простота адаптации, функциональная полнота, эффект оптимизации, производительность и стоимость, а также добавляются новые специальные индикаторы, такие как обработка последовательностей, возможности кода, вероятность успешного вызова агента и разборка задач, чтобы сформировать трехмерную систему оценки.

В день своего выпуска DeepSeek V4 прошел адаптацию Day-0 для нескольких отечественных аппаратных средств, что ознаменовало переход отечественного программного и аппаратного обеспечения искусственного интеллекта на стадию итерации с той же частотой.

Этот тест позволит объективно проверить уровень адаптации, усилить поддержку отечественных вычислительных мощностей и ускорить построение независимой и управляемой экосистемы ИИ.

DeepSeek V4 включает две версии: V4-Pro (флагманская версия) и V4-Flash (облегченная версия). Обе версии изначально поддерживают сверхдлинные контексты длиной 1 миллион токенов (около 750 000 слов). Они используют самостоятельно разработанный механизм разреженного внимания DSA, чтобы снизить стоимость вывода для миллиона контекстов на 70% и сократить использование памяти на 40%.

V4-Pro: общее количество параметров достигает 1,6 триллиона, а параметры активации — 49B. Он ориентирован на максимальный предел производительности, сравнивается с лучшими в мире моделями с закрытым исходным кодом, такими как GPT-5 и Claude Opus, и подходит для сложных рассуждений, генерации кода, расчетов научных исследований и других сложных задач.

V4-Flash: общие параметры 284B, параметры активации 13B, упор на высокую эффективность и низкую стоимость, способность к рассуждению, близкую к версии Pro, более высокую скорость, более низкую цену, подходит для ежедневного взаимодействия, создания контента, легкого корпоративного развертывания и других сценариев.