В октябре 2024 года AMD и Intel совместно создали Консультативную группу по экосистеме x86 (x86 Ecosystem Advisory Group), чтобы объединить лидеров отрасли для совместного продвижения будущего вычислительной архитектуры x86. При создании EAG было объявлено о четырех основных функциях: FRED, AVX10, ChkTag и ACE.Теперь AMD и Intel совместно выпустили технический документ ACE, официально продвигая этот набор инструкций, известный как «Стандартная архитектура матричного ускорения x86», сообществу разработчиков.

Основная цель ACE проста: повысить производительность умножения матриц чипов x86 на порядки.

Умножение матриц — это базовая вычислительная единица нейронных сетей и больших языковых моделей. Хотя существующие наборы команд SIMD, такие как AVX10, могут выполнять матричные операции, существуют очевидные узкие места в вычислительной плотности и масштабируемости.

Внедряя механизм матричного ускорения, основанный на операциях внешнего произведения, ACE достигает вычислительной плотности, которая в 16 раз превышает эквивалентную операцию умножения-накопления AVX10 при использовании того же входного вектора.

Что касается поддержки форматов данных, ACE изначально охватывает текущие основные стандарты точности в области искусственного интеллекта, включая INT8, OCP FP8, OCP MXFP8, OCP MXINT8 и BF16.

Экологическая адаптация программного обеспечения ACE, являющегося расширенным набором команд AVX10, уже находится в стадии разработки. Базовые библиотеки глубокого обучения и высокопроизводительных вычислений, библиотеки научных вычислений Python, такие как NumPy и SciPy, а также основные платформы машинного обучения, такие как PyTorch и TensorFlow, начали работу по интеграции.

AMD и Intel подчеркнули в официальном документе, что концепция дизайна ACE заключается в минимальном трении и широком охвате. От ноутбуков до суперкомпьютеров разработчикам не нужно переписывать код для разных аппаратных платформ.

Это резко контрастирует с решением по переносу вычислений ИИ на выделенные ускорители, которое часто требует дополнительных затрат на адаптацию кода и миграцию.