CES — NVIDIA объявила о серии обновлений для видеокарт GeForce RTX, рабочих станций NVIDIA RTX PRO и компактных суперкомпьютеров DGX Spark. Эти улучшения раскрывают потенциал локальных ИИ-ПК для генерации видео, изображений и текста, обеспечивая высокую производительность, конфиденциальность и низкую задержку.
Генерация видео в 4K в 3 раза быстрее
NVIDIA представила новый конвейер генерации видео на базе RTX, который позволяет художникам точно контролировать процесс создания контента, ускорять его в 3 раза и масштабировать до 4K, используя лишь часть видеопамяти (VRAM).
Конвейер состоит из трех этапов (blueprints), которые можно комбинировать:
- Генератор 3D-объектов для создания ассетов сцены.
- Генератор изображений на основе 3D-сцены в Blender для создания фотореалистичных ключевых кадров.
- Видеогенератор, анимирующий переход между ключевыми кадрами и улучшающий качество до 4K с помощью технологий NVIDIA RTX Video.
Основой этого процесса стала новая модель LTX-2 от Lightricks, доступная для скачивания уже сегодня. Это локальная модель с открытыми весами, способная генерировать до 20 секунд 4K-видео со встроенным аудио и поддержкой нескольких ключевых кадров, не уступая по качеству облачным аналогам.
Оптимизация ComfyUI и экономия памяти
Благодаря тесному сотрудничеству с разработчиками ComfyUI, производительность на GPU NVIDIA выросла на 40%. Ключевые обновления:
- Поддержка форматов NVFP4 и NVFP8: На видеокартах серии RTX 50 использование формата NVFP4 ускоряет работу в 3 раза и снижает потребление VRAM на 60%. Формат NVFP8 дает ускорение в 2 раза и экономию памяти на 40%.
- Доступные модели: Чекпоинты в новых форматах уже доступны для LTX-2, FLUX.1/FLUX.2 (Black Forest Labs), а также Qwen-Image и Z-Image (Alibaba).
- RTX Video Super Resolution в ComfyUI: Новый узел (node) для апскейлинга видео до 4K в реальном времени, устраняющий артефакты сжатия. Будет доступен в следующем месяце.
- Weight Streaming: Улучшенная функция выгрузки данных позволяет использовать системную оперативную память при нехватке VRAM, что дает возможность запускать большие модели на видеокартах среднего уровня.
Новый способ поиска файлов и видео: Nexa.ai Hyperlink
Агент локального поиска Hyperlink от Nexa.ai превращает ПК в базу знаний, отвечающую на вопросы на естественном языке. Все данные обрабатываются локально, обеспечивая полную приватность.
- Скорость: Индексация текста и изображений занимает 30 секунд на гигабайт (против часа на CPU), а ответ формируется за 3 секунды на RTX 5090.
- Поиск по видео (Beta): Новая функция позволяет искать объекты, действия и речь внутри видеороликов. Идеально подходит для монтажаеров и геймеров, желающих найти конкретные моменты в записях.
Ускорение малых языковых моделей (SLM)
Совместная работа с сообществами Ollama и llama.cpp принесла значительный прирост производительности для локальных языковых моделей:
- Ускорение инференса на 35% для llama.cpp и на 30% для Ollama.
- Особенно заметен прогресс для моделей типа «смесь экспертов» (MoE), включая новое семейство NVIDIA Nemotron 3.
- Ускорена загрузка моделей в llama.cpp.
Эти обновления скоро появятся в LM Studio и приложениях вроде MSI AI Robot.
Обновление NVIDIA Broadcast 2.1
Популярное приложение для стримеров и конференций получило улучшение эффекта Virtual Key Light (виртуальный ключевой свет):
- Теперь доступно для видеокарт начиная с GeForce RTX 3060.
- Улучшена работа при сложном освещении и расширен контроль цветовой температуры.
- Обновленная HDRi-карта для имитации профессиональной схемы освещения с двумя источниками света.
DGX Spark: Суперкомпьютер на рабочем столе становится мощнее
Компактный ИИ-суперкомпьютер NVIDIA DGX Spark, предназначенный для разгрузки основного ПК при тяжелых задачах, получил программные оптимизации, увеличившие его производительность в 2.6 раза всего за три месяца с момента запуска.
Также стали доступны новые руководства (playbooks) для DGX Spark, включая настройки для спекулятивного декодирования и дообучения моделей с использованием двух модулей Spark одновременно.
