После нескольких лет производства чипов, которые можно использовать как для обучения моделей искусственного интеллекта, так и для вывода, Google разделяет эти две задачи на разные процессоры, что является ее последним шагом к конкуренции с Nvidia в области аппаратного обеспечения искусственного интеллекта. В среду Google объявила, что внесет это изменение в свой тензорный процессор (TPU) восьмого поколения, выпуск обоих чипов запланирован на конец этого года.

Амин Вахдат, старший вице-президент Google и главный технический директор по искусственному интеллекту и инфраструктуре, сказал в своем блоге: «С появлением агентов искусственного интеллекта мы считаем, что отрасль выиграет от чипов, которые профессионально настроены для нужд обучения и развертывания».

В марте этого года Nvidia продвигала свой будущий чип, который позволит моделям быстро реагировать на вопросы пользователей с помощью технологии, приобретенной в результате приобретения стартапа по производству чипов Groq за 20 миллиардов долларов. Google является крупным клиентом Nvidia, но также предлагает TPU в качестве альтернативы компаниям, использующим ее облачные сервисы.

Большинство ведущих мировых технологических компаний разрабатывают полупроводники для искусственного интеллекта, чтобы максимизировать эффективность вычислений и удовлетворить потребности конкретных сценариев применения. Apple уже много лет разрабатывает свои собственные компоненты искусственного интеллекта для нейронных сетей в чипах iPhone; Microsoft выпустила свой AI-чип второго поколения в январе этого года; На прошлой неделе Meta объявила, что сотрудничает с Broadcom в разработке различных процессоров искусственного интеллекта.

Google является пионером в этом направлении. В 2015 году Google начала использовать чипы собственной разработки для запуска моделей искусственного интеллекта, а в 2018 году открыла аренду для клиентов облачных сервисов. Amazon Cloud Technology выпустила чип Inferentia для обработки запросов ИИ в 2018 году и процессор Trainium для обучения моделей ИИ в 2020 году.

В сентябре прошлого года аналитики инвестиционного института DADavidson подсчитали, что общая стоимость бизнеса ТПУ и команды Google DeepMind по искусственному интеллекту составила примерно 900 миллиардов долларов США.

В настоящее время ни один технологический гигант не может заменить Nvidia, а Google даже не сравнила производительность нового чипа с продукцией лидера в области AI-чипов. Однако в Google заявили, что производительность нового обучающего чипа в 2,8 раза выше, чем у Ironwood TPU седьмого поколения, выпущенного в ноябре прошлого года, а цена такая же; Производительность чипа вывода увеличена на 80%.

Nvidia заявила, что ее предстоящее оборудование Groq3LPU будет использовать большие объемы статической оперативной памяти (SRAM) — технологию, которая также используется производителем AI-чипов Cerebras, который ранее в этом месяце подал заявку на листинг. Новый чип вывода Google под кодовым названием TPU8i также оснащен SRAM. Один чип имеет встроенную SRAM объемом 384 МБ, а его емкость в три раза превышает емкость Ironwood TPU.

Сундар Пичаи, генеральный директор материнской компании Google Alphabet, написал в блоге, что архитектура чипа разработана для «достижения огромной пропускной способности и низкой задержки при экономичном способе удовлетворения потребностей в одновременной работе миллионов агентов».

Масштаб применения чипов Google AI расширяется. Google заявила, что Citadel Securities создала программное обеспечение для количественных исследований на основе Google TPU, и все 17 национальных лабораторий Министерства энергетики США используют программное обеспечение для совместной работы ученых с искусственным интеллектом, разработанное на основе этого чипа; Компания Anthropic, занимающаяся искусственным интеллектом, также взяла на себя обязательство использовать несколько гигаватт вычислительной мощности Google TPU.