Впервые было представлено физическое изображение искусственного интеллекта нового поколения Ascend 950 от Huawei, демонстрирующее форму упаковки чипа собственной разработки компании и собственной разработки памяти с высокой пропускной способностью (HBM). Этот чип объединяет в одном корпусе HBM собственной разработки Huawei первого поколения и новое поколение блоков ускорения искусственного интеллекта. Он предназначен для крупномасштабных вычислительных кластеров и конкурирует по масштабу системы и плотности кластера, а не «жестким» конкурентам, таким как Nvidia, с точки зрения производительности одного чипа.

Ранее компания Huawei объявила, что официальный запуск серии Ascend 950 запланирован на начало 2026 года и будет включать как минимум две модели.

Отчеты показывают, что среди серии Ascend 950 версия 950PR включает в себя HBM собственной разработки Huawei на 128 ГБ с пропускной способностью примерно 1,6 ТБ/с; в то время как версия 950DT увеличивает емкость до 144 ГБ и значительно увеличивает пропускную способность почти до 4 ТБ/с. Целевые вычислительные мощности обоих чипов составляют производительность уровня FP8 в 1 петафлопс и производительность уровня FP4 в 2 петафлопс для одной карты, что соответствует текущим основным сценариям вывода и обучения больших моделей. Общая стратегия Huawei уделяет больше внимания высокоплотной упаковке и эффективным межсетевым связям, а также компенсирует разрыв в производительности одного кристалла за счет повышения вычислительной мощности и эффективности межсетевых соединений на уровне шкафа и центра обработки данных.

Что касается производственного процесса, в статье отмечается, что в настоящее время нет официально подтвержденной информации о технологических узлах, но в отрасли в целом ожидают, что Ascend 950, скорее всего, будет использовать новейший техпроцесс SMIC N+3, который классифицируется как 5-нм техпроцесс. Ранее SMIC объявила, что ее узел N+3 достиг массового производства, не полагаясь на оборудование EUV, а первым публичным заказчиком является терминальный продукт Huawei, оснащенный SoC Kirin 9030. В этом контексте, поскольку Ascend 950 является стратегическим продуктом ускорения искусственного интеллекта Huawei, считается «естественным» вывод, что Ascend 950 использует тот же узел.

Судя по физическому изображению, Ascend 950 имеет многочиповую конструкцию корпуса. Ядро представляет собой два кристалла вычислительного чипа, которые соединены с двумя дополнительными кристаллами предполагаемого ввода-вывода и сетевыми чипами, образуя многочиповый модуль (MCM). Предполагается, что эти чипы ввода-вывода и сетевые чипы отвечают за подключение карт-ускорителей к более крупным кластерам SuperPoD и SuperCluster, обеспечивая высокоскоростное соединение сотен тысяч карт Ascend 950 с помощью нового поколения протокола соединения «Lingqu» и технологии оптического соединения. Предполагается, что модуль с кольцевой структурой упаковки, распределенной вокруг кристалла и похожей на «гибридную форму LPDDR/HBM», является пакетом HBM, разработанным Huawei самостоятельно. Скорее всего, он будет производиться в отдельном корпусе, а затем компоноваться и интегрироваться на подложке ускорителя в корпусе системного уровня.

В целом, дизайн Ascend 950 имеет некоторое сходство с высокопроизводительными графическими процессорами, такими как NVIDIA Blackwell. Оба используют двухчиповый корпус для объединения большей вычислительной мощности на одной карте и полагаются на HBM с высокой пропускной способностью и выделенные протоколы межсоединений для создания крупномасштабных вычислительных кластеров. Разница в том, что Huawei на текущем этапе больше ориентирована на идею «победы за счет масштаба», надеясь сформировать альтернативные решения на рынках мощностей центров обработки данных и облачных вычислений с использованием искусственного интеллекта за счет плотной упаковки, межкартового соединения и суперкластерных решений, одновременно усиливая независимую управляемость локальной цепочки поставок.