CES — NVIDIA объявила, что процессор обработки данных NVIDIA BlueField®-4 лежит в основе новой платформы хранения контекста для логического вывода (NVIDIA Inference Context Memory Storage Platform). Это решение представляет собой новый класс инфраструктуры хранения, специально разработанной для следующего этапа развития искусственного интеллекта.
Проблема и решение
Современные ИИ-модели с триллионами параметров и способностью к многошаговому рассуждению генерируют огромные объемы контекстных данных, хранящихся в KV-кэше (key-value cache). Этот кэш критически важен для точности, непрерывности диалога и качества ответа.
Традиционное хранение KV-кэша на GPU создает узкие места при работе мультиагентных систем в реальном времени. Новая платформа от NVIDIA решает эту проблему, расширяя емкость памяти GPU и обеспечивая высокоскоростной обмен данными между узлами.
Ключевые преимущества:
- Производительность: Увеличение количества обрабатываемых токенов в секунду до 5 раз.
- Энергоэффективность: В 5 раз выше по сравнению с традиционными системами хранения.
- Масштабируемость: Поддержка долгосрочного контекста и многоагентного взаимодействия без потери скорости отклика.
- Интеллектуальный обмен данными: Аппаратно ускоренное распределение KV-кэша через сеть благодаря интеграции с NVIDIA DOCA™, NIXL и Dynamo.
- Безопасность и изоляция: BlueField-4 управляет размещением кэша, устраняя накладные расходы метаданных и обеспечивая безопасный доступ со стороны GPU-узлов.
- Высокоскоростная сеть: Использование NVIDIA Spectrum-X™ Ethernet для быстрого доступа к данным на базе RDMA.
«ИИ революционизирует весь вычислительный стек, и теперь очередь дошла до хранения данных. ИИ больше не ограничивается чат-ботами с одним вопросом — это интеллектуальные помощники, обладающие краткосрочной и долгосрочной памятью. С BlueField-4 мы переизобретаем стек хранения данных для новой эры ИИ», — заявил Дженсен Хуанг, основатель и генеральный директор NVIDIA.
Поддержка партнеров и доступность
Ведущие производители систем хранения данных, включая AIC, Cloudian, DDN, Dell Technologies, HPE, Hitachi Vantara, IBM, Nutanix, Pure Storage, Supermicro, VAST Data и WEKA, уже работают над созданием решений нового поколения на базе BlueField-4.
Дата выхода: Решения на базе NVIDIA BlueField-4 станут доступны во второй половине 2026 года.
