Как NVIDIA планирует разработку своих графических процессоров и систем искусственного интеллекта к 2028 году

18 июня 2026

Дорожная карта NVIDIA до 2028 года — больше, чем просто смена поколений видеокарт. Новые GPU NVIDIA, запланированные на 2027–2028 годы, будут продаваться в составе крупных вычислительных модулей вместе с ARM-процессорами, сетевыми картами, средствами защиты информации и другими компонентами. Это соответствует концепции фабрик искусственного интеллекта (AI Factory), в которой дата-центры должны становиться более производительными, плотными, энергоэффективными и самодостаточными.

Купить GPU-сервер

Далее — подробно о разработке графических процессоров NVIDIA в ближайшие годы.

Дорожная карта NVIDIA до 2028 года

Период	Платформа / архитектура	Статус данных	Главное преимущество
III квартал 2026	NVIDIA Vera Rubin NVL72	Официальный анонс	72 Rubin GPU, 36 Vera CPU, NVLink 6, ConnectX-9, BlueField-4 в одной стоечной системе
IV квартал 2026	NVIDIA Rubin CPX / Vera Rubin NVL144 CPX	Официальный анонс	128 GB GDDR7, до 30 PFLOPS NVFP4, в 3 раза более быстрая обработка длинного контекста по сравнению с GB300 NVL72
2027	NVIDIA Rubin Ultra / Vera Rubin Ultra NVL576	Roadmap и технический блог NVIDIA	До 576 GPU в одном NVLink-домене через 8-стоечную топологию
2028	NVIDIA Feynman GPU	Roadmap / GTC-анонс	Следующая архитектура после Rubin Ultra для полной AI-инфраструктуры: вычислений, памяти, хранилищ, сети и безопасности

NVIDIA Blackwell GPU для дата-центров и рабочих станций: отправная точка дорожной карты

Дата выхода: NVIDIA Blackwell Ultra GB300 NVL72 — декабрь 2025, RTX PRO Blackwell — март 2025.
Главное преимущество: Blackwell Ultra масштабируется до 72 GPU в стоечной системе. RTX PRO Blackwell дает до 96 GB GDDR7 ECC в профессиональных рабочих станциях и серверах.

NVIDIA Blackwell — это текущее поколение профессиональных видеокарт и AI-систем, с которого начинается дорожная карта производителя. В дата-центрах оно представлено системами Blackwell Ultra и GB300 NVL72 для крупных AI-нагрузок, а в рабочих станциях и enterprise-серверах — линейкой RTX PRO Blackwell.

Главное отличие NVIDIA Blackwell Ultra от предыдущей архитектуры — комплексное проектирование платформы под генеративный AI и большие языковые модели. Компания сосредотачивается не на повышении чистой вычислительной мощности графических адаптеров, а на реальной производительности в инференсе и обучении искусственного интеллекта.

Source: https://www.naddod.com/blog/nvidia-unveils-most-powerful-gpu-blackwell-b200-unleashes-ai-performance-speed?srsltid=AfmBOopTuHUDTESBOztlIBtrrdC-nx51jBsuMVm3vETjgzaopw1-h-B-

Почему это важно для AI: Blackwell — актуальное поколение специализированных стоечных систем искусственного интеллекта NVIDIA. Их графические процессоры, драйверы и память разрабатывались именно для использования в AI-серверах и дата-центрах. Они имеют соответствующую физическую конструкцию модулей питания и охлаждения, рассчитанную на непрерывную работу с высокой нагрузкой в стоечных корпусах.

NVIDIA Vera Rubin: как GPU-серверы превращаются в AI Factory

Ориентировочная дата выхода: III квартал 2026 года.
Источники данных: продуктовые спецификации, официальные релизы.
Главное преимущество: комплексная система с процессорами, графическими адаптерами и сетевой инфраструктурой для быстрого масштабирования дата-центров.

NVIDIA Vera Rubin — это комплексные системы искусственного интеллекта, созданные специально для нужд дата-центров, масштабных AI-проектов и другого крупного бизнеса. Их отличие от Blackwell заключается в том, что производитель предлагает не просто GPU, а целую стоечную систему: графические процессоры, центральные процессоры, быстрые соединения, сетевые адаптеры и модули обработки данных для служебных задач. Помимо специализированных графических процессоров NVIDIA для AI, они содержат:

Компонент	Роль
Vera CPU	Управляет работой системы, передает данные между компонентами и выполняет CPU-задачи для AI-агентов
NVLink 6	Быстро соединяет GPU внутри одной стойки, чтобы они работали как единая система
ConnectX-9	Соединяет несколько серверов или стоек в один более крупный AI-кластер
BlueField-4	Берет на себя часть сетевых, защитных и дисковых задач, чтобы не нагружать CPU и GPU
Spectrum-6 / Spectrum-X	Создает сетевую основу для крупных AI-дата-центров

В состав стоечной системы входят 72 NVIDIA Rubin GPU R100 с такими характеристиками:

техпроцесс — TSMC N3P 3 нанометра;
количество транзисторов — 336 миллиардов;
объем памяти — 288 ГБ;
тип памяти — HBM4 ECC;
пропускная способность памяти — до 22 ТБ/с;
скорость соединения NVLink — до 3,6 ТБ/с;
сетевой интерфейс — до 1,6 Тбит/с;
TDP — 2300 Вт.

Source: https://substackcdn.com/image/fetch/$s_!NB4l!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7257cc0c-a57b-4aa2-b03b-1ead3d930e8c_4800x2700.png

Почему это важно для AI: архитектура NVIDIA Rubin разрабатывалась с прицелом на актуальные варианты искусственного интеллекта — передовые модели (frontier models), модели смешанной экспертизы (MoE) и агентные сценарии, где много GPU должны работать как один вычислительный домен. В таких задачах слабым местом часто становится обмен данными между видеокартами, и комплексный подход с разными типами компонентов в одной системе призван закрывать этот недостаток.

NVIDIA Rubin CPX: узкоспециализированная AI-архитектура

Ориентировочная дата выхода: IV квартал 2026 года.
Источники данных: официальный анонс, технический блог производителя.
Главное преимущество: один из первых специализированных чипов NVIDIA для inference больших языковых моделей.

Rubin CPX — специализированный AI-ускоритель NVIDIA, созданный для инференса с очень длинным контекстом. Это уже не универсальная GPU, а узкопрофильный чип с оптимизированной архитектурой и программной составляющей.

Rubin CPX должен использоваться там, где AI-модель должна держать наготове большой объем контекста. Для кодинговых агентов это может быть репозиторий, для генерации видео — длинная последовательность кадров, а для корпоративного RAG — большая база документов.

Характеристики AI-процессора NVIDIA:

Архитектура	NVIDIA Rubin
Тип GPU	GPU для инференса с очень длинным контекстом
Память	128 GB GDDR7
Производительность в AI-вычислениях	До 30 PFLOPS NVFP4
Обработка длинного контекста	До 3× быстрее по сравнению с GB300 NVL72
Система	Vera Rubin NVL144 CPX
Соединение с другими GPU и стойками	Quantum-X800 InfiniBand или Spectrum-X Ethernet
Сеть	ConnectX-9 SuperNIC
Основные задачи	Анализ крупных кодовых баз, генерация видео, обработка документов и AI-запросов с очень длинным контекстом

Source: https://www.tweaktown.com/news/107645/nvidia-rubin-cpx-gpu-to-feature-128gb-gddr7-memory-launches-end-of-2026/index.html

Почему это важно для AI: в будущих NVIDIA AI Factories вычислительные кластеры должны разделяться по функциональности и назначению для повышения производительности и энергоэффективности. Чип Rubin CPX должен закрывать именно контекстную фазу инференса. Он важен для будущих AI-сервисов, где стоимость и скорость ответа будут зависеть от того, как система работает с длинным контекстом.

NVIDIA Rubin Ultra: новое поколение для крупных AI-кластеров

Ориентировочная дата выхода: III–IV квартал 2027 года.
Источники данных: технический блог производителя.
Главное преимущество: концепция NVIDIA AI Factory реализуется через объединение 8 стоек по 72 GPU в единую высокопроизводительную систему. Это упрощает построение кластеров и расширяет возможности их коммуникации в сети.

NVIDIA Rubin Ultra базируется на той же архитектуре. Главное отличие — новые связи между стойками на базе медных проводов и оптических линий. Это уменьшает задержки в обработке данных и увеличивает общую производительность масштабных дата-центров с GPU NVIDIA,

Другие данные — пока из разряда слухов и неподтвержденных инсайдов. В частности, WCFTech публикует такие прогнозы:

компоновка с 1 или 2 чипами на плате. Каждый будет иметь по 2 чиплета (ранее были слухи о 4-чиплетной схеме, но они не подтвердились);
до 768 ГБ или 1 ТБ памяти HBM4E на плату с пропускной способностью 22 ТБ/с;
TDP 1800 или 2300 Вт.

Source: https://x.com/IanCutress/status/1902067320912277936

Почему это важно для AI: Rubin Ultra — это инфраструктура NVIDIA для больших языковых моделей в глобальных масштабах. Эта серия графических адаптеров позволяет быстрее проектировать крупные AI-кластеры на базе типовых стоечных конфигураций. Но ее минус заключается в том, что масштабирование бизнеса в таком формате становится менее гибким и доступным — нужны крупные инвестиции в само оборудование, питание, охлаждение, системы безопасности.

NVIDIA Feynman GPU: замкнутая AI-экосистема

Ориентировочная дата выхода: 2028 год, наиболее вероятно — вторая половина.
Источники данных: GTC-анонс.
Главное преимущество: компания готовится продавать блочные дата-центры NVIDIA для AI. Feynman должен охватывать все ключевые процессы работы с искусственным интеллектом — вычисления, хранение информации, коммуникации и защиту данных.

NVIDIA Feynman GPU — комплексное решение NVIDIA для генеративного AI и других видов искусственного интеллекта. Оно развивает полную экосистему вокруг видеокарт, позволяя заказывать комплектацию дата-центров «под ключ».

Идея не в том, чтобы продавать отдельный GPU, а в том, чтобы поставлять набор совместимых компонентов для вычислений, памяти, сети, хранилищ и защиты данных. Для крупных дата-центров это упрощает проектирование системы, поскольку ключевые компоненты создаются в одной экосистеме. Но есть и обратная сторона: чем больше уровней инфраструктуры закрывает один производитель, тем сложнее бизнесу будет комбинировать оборудование разных вендоров, менять платформу или выходить из экосистемы без больших затрат.

Согласно NVIDIA roadmap 2028, для Feynman важнее всего будут скорость передачи данных, стабильность памяти, масштабирование между стойками, энергоэффективность и защита инфраструктуры. В этой архитектуре компания продолжает смещение приоритетов с чистой вычислительной мощности видеокарт к прикладной производительности в конкретных задачах.

Source: https://www.techpowerup.com/341011/nvidia-to-tap-tsmcs-a16-node-for-feynman-gpus

Почему это важно для AI: формирование замкнутой экосистемы упрощает запуск новых моделей искусственного интеллекта и сервисов на их базе. Такой подход уменьшит затраты времени и ресурсов на создание IT-инфраструктуры для крупного технологического бизнеса.

NVIDIA GeForce RTX 6000: будущее гейминга под вопросом

В отличие от AI-чипов, будущие видеокарты NVIDIA в потребительском сегменте так и не были анонсированы в первой половине 2026 года. Ожидается, что первая информация о них появится в начале 2027 года, поставки начнутся во второй половине года, а стабильные розничные продажи — ближе к 2028.

Компания также не раскрывает данные о графических чипах NVIDIA 2028 года. Инсайдеры утверждают, что новое поколение видеокарт будет построено на архитектуре Rubin с 3-нм техпроцессом. Ожидается, что в операциях с трассировкой лучей (RT) и интеллектуальным масштабированием (DLSS) их производительность увеличится на 100% по сравнению с поколением Blackwell. В других сценариях прирост мощности будет меньше — около 30–35%.

YouTube-канал RedGamingTech также приводит ожидаемые характеристики на основе утечек информации:

GeForce RTX 6090 — 192 потоковых мультипроцессора, 24+ тысячи ядер CUDA, частота в диапазоне 2–3 ГГц, 32 ГБ памяти GDDR7, 512-битная шина.
GeForce RTX 6080 — 20 ГБ памяти, 320-битная шина.
GeForce RTX 6070 — 16 ГБ памяти, 256-битная шина.

Стоит отметить: данные не имеют официального подтверждения, поэтому их не стоит использовать для планирования будущих покупок.

Если эти утечки подтвердятся, новые видеокарты могут получить тензорные ядра 6 поколения и ядра трассировки лучей 5 поколения. Для них могут быть доступны определенные технологии искусственного интеллекта NVIDIA, которые раньше использовались только в профессиональных моделях, поэтому топовые модели будут лучше вести себя в AI-пайплайнах.

Вывод: что показывает дорожная карта NVIDIA

Технические планы компании показывают главное направление ее развития — переход от универсальных видеокарт к специализированным чипам NVIDIA для искусственного интеллекта, а также от отдельных плат к комплектным стойкам и блочным дата-центрам. Производитель нацелен на глобальное лидерство в сегменте AI и хочет обеспечивать своих клиентов более простой, удобной и понятной с точки зрения экономики эксплуатации продукцией.

Поделится

Новый комментарий

Войти с помощью