Ведущая платформа ИИ получает ускорение RTX от новых GeForce RTX SUPER GPUs и AI-ноутбуков от ведущих производителей.
NVIDIA приносит генеративный ИИ миллионам пользователей с помощью Tensor Core GPUs, LLMs и инструментов для RTX PC и рабочих станций
CES — Сегодня NVIDIA анонсировала GeForce RTX™ SUPER настольные GPU для ускоренной производительности генеративного ИИ, новые AI-ноутбуки от ведущих производителей и новые программные инструменты и инструменты NVIDIA RTX™-Accelerated AI как для разработчиков, так и для пользователей.
Опираясь на десятилетия лидерства в области ПК, с более чем 100 миллионами своих RTX GPU, которые определяют эпоху AI PC, NVIDIA теперь предлагает эти инструменты для улучшения пользовательского опыта с генеративным ИИ: ускорение NVIDIA TensorRT™ популярной модели Stable Diffusion XL для текстовых рабочих процессов, NVIDIA RTX Remix с генеративными инструментами текстур, микросервисы NVIDIA ACE и больше игр, использующих технологию DLSS 3 с генерацией кадров.
AI Workbench, унифицированный и простой в использовании набор инструментов для разработчиков ИИ, будет доступен в бета-версии позже в этом месяце. Кроме того, NVIDIA TensorRT-LLM (TRT-LLM), библиотека с открытым исходным кодом, которая ускоряет и оптимизирует производительность вывода последних больших языковых моделей (LLMs), теперь поддерживает больше предоптимизированных моделей для ПК. Ускоренный TRT-LLM, Chat with RTX, техническая демонстрация NVIDIA, которая также будет выпущена в этом месяце, позволяет энтузиастам ИИ взаимодействовать со своими заметками, документами и другим контентом.
“Генеративный ИИ — это самый значительный переход в истории вычислительной техники и изменит каждую отрасль, включая игры”, — сказал Дженсен Хуанг, основатель и генеральный директор NVIDIA. “С более чем 100 миллионами RTX AI PC и рабочих станций NVIDIA является огромной установленной базой для разработчиков и геймеров, чтобы наслаждаться магией генеративного ИИ.”
Запуск генеративного ИИ локально на ПК критичен для приложений, чувствительных к конфиденциальности, задержкам и затратам. Это требует большой установленной базы систем, готовых к ИИ, а также правильных инструментов для разработчиков, чтобы настроить и оптимизировать модели ИИ для платформы ПК.
Для удовлетворения этих потребностей NVIDIA предлагает инновации по всему своему технологическому стеку, создавая новые впечатления и строя на основе более чем 500 приложений и игр для ПК с поддержкой ИИ, уже ускоренных технологией NVIDIA RTX.
RTX AI PC и рабочие станции
GPU NVIDIA RTX, способные запускать широкий спектр приложений с максимальной производительностью, раскрывают весь потенциал генеративного ИИ на ПК. Tensor Cores в этих GPU значительно ускоряют производительность ИИ в самых требовательных приложениях для работы и игр.
Новые видеокарты GeForce RTX 40 SUPER Series, также анонсированные сегодня на CES, включают GeForce RTX 4080 SUPER, 4070 Ti SUPER и 4070 SUPER для максимальной производительности ИИ. GeForce RTX 4080 SUPER генерирует AI-видео в 1,5 раза быстрее и изображения в 1,7 раза быстрее, чем GPU GeForce RTX 3080 Ti. Tensor Cores в SUPER GPU обеспечивают до 836 триллионов операций в секунду, принося трансформационные возможности ИИ в игры, создание и повседневную производительность.
Ведущие производители, включая Acer, ASUS, Dell, HP, Lenovo, MSI, Razer и Samsung, выпускают новую волну RTX AI-ноутбуков, которые приносят полный набор возможностей генеративного ИИ пользователям прямо из коробки. Новые системы, которые обеспечивают увеличение производительности от 20x до 60x по сравнению с использованием нейронных процессоров, начнут поставляться в этом месяце.
Мобильные рабочие станции с GPU RTX могут запускать программное обеспечение NVIDIA AI Enterprise, включая TensorRT и NVIDIA RAPIDS™ для упрощенной и безопасной разработки генеративного ИИ и науки о данных. Трехлетняя лицензия на NVIDIA AI Enterprise включена в каждую NVIDIA A800 40GB Active GPU, что делает ее идеальной платформой для разработки рабочих станций для ИИ и науки о данных.
Новые инструменты для разработчиков ПК для создания моделей ИИ
Чтобы помочь разработчикам быстро создавать, тестировать и настраивать предобученные модели генеративного ИИ и LLMs с использованием производительности и объема памяти класса ПК, NVIDIA недавно анонсировала NVIDIA AI Workbench.
AI Workbench, который будет доступен в бета-версии позже в этом месяце, предлагает упрощенный доступ к популярным репозиториям, таким как Hugging Face, GitHub и NVIDIA NGC™, а также упрощенный пользовательский интерфейс, который позволяет разработчикам легко воспроизводить, сотрудничать и переносить проекты.
Проекты можно масштабировать практически в любом месте — будь то центр обработки данных, общедоступное облако или NVIDIA DGX™ Cloud — а затем вернуть на локальные RTX-системы на ПК или рабочую станцию для вывода и легкой настройки.
В сотрудничестве с HP NVIDIA также упрощает разработку моделей ИИ, интегрируя NVIDIA AI Foundation Models и Endpoints, которые включают RTX-ускоренные модели ИИ и наборы для разработки программного обеспечения, в HP AI Studio, централизованную платформу для науки о данных. Это позволит пользователям легко искать, импортировать и развертывать оптимизированные модели на ПК и в облаке.
После создания моделей ИИ для использования на ПК разработчики могут оптимизировать их с помощью NVIDIA TensorRT, чтобы полностью использовать Tensor Cores GPU RTX.
NVIDIA недавно расширила TensorRT до текстовых приложений с помощью TensorRT-LLM для Windows, библиотеки с открытым исходным кодом для ускорения LLMs. Последнее обновление TensorRT-LLM, доступное сейчас, добавляет Phi-2 в растущий список предоптимизированных моделей для ПК, которые работают до 5 раз быстрее по сравнению с другими инференциальными бэкендами.
RTX-ускоренный генеративный ИИ обеспечивает новые впечатления от ПК
На CES NVIDIA и ее партнеры-разработчики выпускают новые приложения и услуги для ПК, работающие на генеративном ИИ, включая:
- NVIDIA RTX Remix, платформа для создания потрясающих RTX-ремастеров классических игр. Выпускается в бета-версии позже в этом месяце, она предоставляет генеративные инструменты ИИ, которые могут преобразовать базовые текстуры из классических игр в современные материалы с физически обоснованной визуализацией в разрешении 4K.
- Микросервисы NVIDIA ACE, включая модели речи и анимации на основе генеративного ИИ, которые позволяют разработчикам добавлять в игры умные, динамичные цифровые аватары.
- Ускорение TensorRT для Stable Diffusion XL (SDXL) Turbo и моделей латентной согласованности, двух самых популярных методов ускорения Stable Diffusion. TensorRT улучшает производительность для обоих до 60% по сравнению с предыдущей самой быстрой реализацией. Также доступно обновленное расширение Stable Diffusion WebUI TensorRT, включая ускорение для SDXL, SDXL Turbo, LCM - Low-Rank Adaptation (LoRA) и улучшенную поддержку LoRA.
- NVIDIA DLSS 3 с генерацией кадров, которая использует ИИ для увеличения частоты кадров до 4 раз по сравнению с нативным рендерингом, будет представлена в дюжине из 14 новых RTX-игр, включая Horizon Forbidden West, Pax Dei и Dragon’s Dogma 2.
- Chat with RTX, техническая демонстрация NVIDIA, доступная позже в этом месяце, позволяет энтузиастам ИИ легко подключать LLMs ПК к своим данным с помощью популярной техники, известной как поиск с усилением генерации (RAG). Демо, ускоренное TensorRT-LLM, позволяет пользователям быстро взаимодействовать со своими заметками, документами и другим контентом. Оно также будет доступно как проект с открытым исходным кодом, так что разработчики могут легко реализовать те же возможности в своих собственных приложениях.
