Последнее сотрудничество между Kioxia и NVIDIA рассматривается как еще один технологический скачок вперед в инфраструктуре центров обработки данных с использованием искусственного интеллекта. Обе компании вместе работают над разработкой твердотельных накопителей, способных обеспечить производительность до 100 миллионов операций ввода-вывода в секунду (IOPS). Эта производительность намного выше текущего максимального уровня SSD, составляющего около 3 миллионов операций ввода-вывода в секунду, что позволяет преодолеть узкое место при передаче данных при крупномасштабном обучении и развертывании моделей искусственного интеллекта.
Если проект окажется успешным, он не только ускорит темпы внедрения инноваций в области генеративного искусственного интеллекта (GenAI), но также изменит архитектуру центров обработки данных, изменит конкурентную среду облачных вычислений и систем хранения данных корпоративного класса, а также установит новые стандарты для всей аппаратной экосистемы.

Производитель полупроводниковой памяти Kioxia разрабатывает новое поколение технологии SSD для удовлетворения потребностей искусственного интеллекта в интенсивном чтении и записи. Компания объявила, что планирует добиться коммерциализации в 2027 году, чтобы случайное количество операций ввода-вывода в секунду SSD достигло 100 миллионов раз. Этот показатель производительности примерно в 30–35 раз превышает показатели существующих продуктов высокого класса. На этот раз Kioxia сотрудничает с NVIDIA для содействия реализации проекта.
На брифинге для СМИ в Токио Киоксиа заявил, что новый твердотельный накопитель будет напрямую подключаться к графическим процессорам NVIDIA, минуя традиционный центральный процессор сервера. Этот метод соединения «точка-точка» значительно повышает скорость потока данных между устройствами хранения и вычислительными устройствами. Он особенно подходит для обучения крупных моделей ИИ, которое основано на частом мелкомасштабном считывании случайных данных, например извлечении встроенных представлений и параметров модели. Традиционные SSD-системы сложно эффективно удовлетворить эти потребности.
NVIDIA поставила перед собой более амбициозную цель: достичь 200 миллионов операций ввода-вывода в секунду с помощью двух таких твердотельных накопителей с поддержкой будущего стандарта PCI Express 7.0. PCIe 7.0 обеспечивает более высокую скорость двухточечной связи графического процессора. Для сравнения, нынешний высокопроизводительный твердотельный накопитель обеспечивает около 3 миллионов операций ввода-вывода в секунду в блоках 4 КБ. Если оно подскочит до 100 миллионов операций ввода-вывода в секунду, это создаст серьезные технические проблемы как для флэш-памяти NAND, так и для архитектуры интерфейса.
Самая многообещающая технология Kioxia — это запатентованное хранилище NAND с однослойной ячейкой (SLC) XL-Flash, которое отличается высокой надежностью, низкой задержкой и высокой производительностью. Каждый чип XL-Flash поддерживает до 16 «плоскостей», в то время как обычная 3D NAND потребительского уровня обычно имеет от 3 до 6 плоскостей.
Хотя Kioxia не опубликовала все технические характеристики, существующие данные испытаний могут дать представление о масштабе задачи: твердотельный накопитель XL-Flash емкостью 400 ГБ, оснащенный 32 микросхемами NAND и использующий интерфейс PCIe 5.0, продемонстрировал производительность примерно 3,5 миллиона операций ввода-вывода в секунду при произвольном чтении. Теоретически, если производительность можно масштабировать идеально линейно, то твердотельный накопитель, оснащенный чипами 915, может достичь 100 миллионов операций ввода-вывода в секунду. Однако на самом деле из-за таких факторов, как пропускная способность контроллера, накладные расходы на встроенное ПО и архитектура системы, этой цели часто трудно достичь простым объединением микросхем, и может потребоваться использование нескольких контроллеров или модульных решений SSD.
Учитывая ограничения традиционного расширения 3D NAND, Kioxia также изучает новую технологию хранения данных, называемую флэш-памятью с высокой пропускной способностью (HBF), целью которой является сочетание скорости памяти с высокой пропускной способностью и большей емкости хранилища. В решении HBF используется усовершенствованная упаковка для объединения до 16 микросхем NAND и одного логического чипа для достижения чрезвычайно высокого уровня параллелизма и пропускной способности. Хотя до сих пор неясно, будет ли HBF использоваться в конечном продукте этого проекта сотрудничества, эти исследования и разработки показывают, что Kioxia предлагает сверхвысокопроизводительные решения для хранения данных в эпоху искусственного интеллекта.