Компания Meta объявила, что внедрила новое решение повторного использования памяти в инфраструктуре своего центра обработки данных. С помощью специально разработанного чипа Vistara он соединит карты памяти DDR4 на вышедших из эксплуатации серверах с серверами нового поколения, использующими память DDR5, тем самым обеспечивая экономию средств и повторное использование ресурсов в условиях высоких мировых цен на оборудование и долгосрочной нехватки памяти.
Мировые цены на память и другие аппаратные компоненты за последний период продолжали расти. Даже крупные технологические компании с огромной покупательной способностью начали искать более эффективные способы контроля капитальных затрат. Подход Меты — это попытка в этой среде.

Согласно текущему циклу эксплуатации и обслуживания «Меты», ее серверы обычно заменяются каждые три-пять лет, однако реальный срок службы модулей памяти в них обычно может достигать семи-десяти лет. Это приводит к тому, что при выводе сервера из эксплуатации модули памяти DDR4, которые все еще неповреждены и пригодны к использованию, приходится отключать, что приводит к большому количеству отходов. Чтобы решить эту проблему «несоответствия сроков службы», компания Meta разработала чип Vistara, чтобы старая память могла продолжать работать на новых платформах, продлевая жизненный цикл оборудования и оптимизируя общую совокупную стоимость владения.
Согласно информации из технического документа, раскрытой на отраслевой конференции ISCA, Vistara представляет собой специальный чип ASIC, который подключает память DDR4 к процессорам нового поколения на шине PCIe Gen5 x16 через интерфейс CXL 2.0/1.1. В некоторых случаях Meta извлекает карты памяти DDR4 из выведенных из эксплуатации серверов и устанавливает их в специализированные устройства, называемые внутри компании «MemServers». Каждый MemServer оснащен примерно 768 ГБ памяти DDR5 и примерно 256 ГБ переработанной памяти DDR4. Операционная система рассматривает эти DDR4 как дополнительные узлы памяти. Когда основные ресурсы DDR5 становятся ограниченными, система может запланировать и использовать эту расширенную память.
Мета заявил, что готовые аппаратные решения CXL не могут удовлетворить этот спрос, поскольку распространенные на рынке интерфейсы CXL обычно комплектуют контроллер собственной памятью, что затрудняет вставку устаревших модулей DDR4 из разных источников. Конструкция Vistara намеренно отделяет контроллер от памяти, позволяя контроллеру существовать независимо, позволяя Meta вставлять имеющиеся ресурсы памяти DDR4 по мере необходимости для достижения очень гибкой архитектуры повторного использования памяти.
На уровне масштаба Meta планирует развернуть эту новую архитектуру в своей гипермасштабируемой инфраструктуре, состоящей из миллионов серверов, особенно в центрах обработки данных, которые поддерживают ее бизнес в области искусственного интеллекта. Поскольку компания продолжает инвестировать в такие области, как генеративный искусственный интеллект, включая широкое внедрение новых моделей с логическими выводами и мультимодальными возможностями, таких как Muse Spark, требования к памяти и вычислительной мощности этих центров обработки данных искусственного интеллекта продолжают расти. Ожидается, что повторное использование памяти DDR4 повысит общую эффективность и при этом обеспечит производительность.
Следует отметить, что Meta не будет полностью полагаться на «восстановленную» память, а недавно приобретенное DDR5 и другое оборудование по-прежнему будут играть важную роль в ее инфраструктуре. Однако в сценариях сверхкрупных центров обработки данных даже использования повторно используемых модулей памяти DDR4 для части рабочей нагрузки достаточно, чтобы обеспечить значительную экономию средств при долгосрочных операциях и сократить потери ресурсов, вызванные утилизацией оборудования.