Дорожня карта NVIDIA до 2028 року — більше ніж просто зміна поколінь відеокарт. Нові GPU NVIDIA, заплановані на 2027–2028 роки, продаватимуться у складі великих обчислювальних модулів разом з ARM-процесорами, мережевими картами, засобами захисту інформації та іншими компонентами. Це відповідає концепції фабрик штучного інтелекту (AI Factory), в якій дата-центри мають ставати більш продуктивними, щільними, енергоефективними і самодостатніми.

Купити GPU сервер

Далі — докладно про розробку графічних процесорів NVIDIA у найближчі роки. 

Дорожня карта NVIDIA до 2028 року

Період Платформа / архітектура Статус даних Головна перевага
III квартал 2026 NVIDIA Vera Rubin NVL72 Офіційний анонс 72 Rubin GPU, 36 Vera CPU, NVLink 6, ConnectX-9, BlueField-4 в одній стійковій системі
IV квартал 2026 NVIDIA Rubin CPX / Vera Rubin NVL144 CPX Офіційний анонс 128 GB GDDR7, до 30 PFLOPS NVFP4, у 3 рази швидша обробка довгого контексту проти GB300 NVL72
2027 NVIDIA Rubin Ultra / Vera Rubin Ultra NVL576 Roadmap і технічний блог NVIDIA До 576 GPU в одному NVLink-домені через 8-стійкову топологію
2028 NVIDIA Feynman GPU Roadmap / GTC-анонс Наступна архітектура після Rubin Ultra для повної AI-інфраструктури: обчислень, пам’яті, сховищ, мережі та безпеки

NVIDIA Blackwell GPU для дата-центрів і робочих станцій: відправна точка дорожньої карти

  • Дата виходу: NVIDIA Blackwell Ultra GB300 NVL72 — грудень 2025, RTX PRO Blackwell — березень 2025. 
  • Головна перевага: Blackwell Ultra масштабується 72 GPU у стійковій системі. RTX PRO Blackwell дає до 96 GB GDDR7 ECC у професійних робочих станціях і серверах. 

NVIDIA Blackwell — це поточне покоління професійних відеокарт та AI-систем, з якого починається дорожня карта виробника. У дата-центрах воно представлене системами Blackwell Ultra та GB300 NVL72 для великих ШІ-навантажень, а в робочих станціях і enterprise-серверах — лінійкою RTX PRO Blackwell.

Головна відмінність NVIDIA Blackwell Ultra від попередньої архітектури — комплексне проєктування платформи під генеративний AI та великі мовні моделі. Компанія зосереджується не на підвищенні чистої обчислювальної потужності графічних адаптерів, а на реальній продуктивності в інференсі та навчанні штучного інтелекту.

NVIDIA Blackwell B200: Unveiling the Most Powerful GPU for AI Performance  Speed - NADDOD Blog

Source: https://www.naddod.com/blog/nvidia-unveils-most-powerful-gpu-blackwell-b200-unleashes-ai-performance-speed?srsltid=AfmBOopTuHUDTESBOztlIBtrrdC-nx51jBsuMVm3vETjgzaopw1-h-B-

Чому це важливо для AI: Blackwell — актуальне покоління спеціалізованих стійкових систем штучного інтелекту NVIDIA. Їхні графічні процесори, драйвери й пам’ять розроблялися саме для використання в AI-серверах і дата-центрах. Вони мають відповідну фізичну конструкцію модулів живлення та охолодження, розраховану на безперервну роботу з високим навантаженням у стійкових корпусах. 

NVIDIA Vera Rubin: як GPU-сервери перетворюються на AI Factory

  • Орієнтовна дата виходу: III квартал 2026 року.
  • Джерела даних: продуктові специфікації, офіційні релізи
  • Головна перевага: комплексна система з процесорами, графічними адаптерами та мережевою інфраструктурою для швидкого масштабування дата-центрів. 

NVIDIA Vera Rubin — це комплексні системи штучного інтелекту, створені спеціально для потреб дата-центрів, масштабних AI-проєктів та іншого великого бізнесу. Їх відмінність від Blackwell полягає в тому, що виробник пропонує не просто GPU, а цілу стійкову систему: графічні процесори, центральні процесори, швидкі з’єднання, мережеві адаптери й модулі обробки даних для службових задач. Окрім спеціалізованих графічних процесорів NVIDIA для ШІ, вони містять:

Компонент Роль
Vera CPU Керує роботою системи, передає дані між компонентами та виконує CPU-задачі для AI-агентів
NVLink 6 Швидко з’єднує GPU всередині однієї стійки, щоб вони працювали як єдина система
ConnectX-9 З’єднує кілька серверів або стійок в один більший AI-кластер
BlueField-4 Бере на себе частину мережевих, захисних і дискових задач, щоб не навантажувати CPU та GPU
Spectrum-6 / Spectrum-X Створює мережеву основу для великих AI-дата-центрів

До складу стійкової системи входять 72 NVIDIA Rubin GPU R100 з такими характеристиками:

  • техпроцес — TSMC N3P 3 нанометри;
  • кількість транзисторів — 336 мільярдів;
  • обсяг пам’яті — 288 ГБ;
  • тип пам’яті — HBM4 ECC;
  • пропускна здатність пам’яті — до 22 ТБ/с;
  • швидкість з’єднання NVLink — до 3,6 ТБ/с;
  • мережевий інтерфейс — до 1,6 Тбіт/с;
  • TDP — 2300 Вт.

Vera Rubin – Extreme Co-Design: An Evolution from Grace Blackwell Oberon

Source: https://substackcdn.com/image/fetch/$s_!NB4l!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7257cc0c-a57b-4aa2-b03b-1ead3d930e8c_4800x2700.png

Чому це важливо для AI: архітектура NVIDIA Rubin розроблялася з прицілом на актуальні варіанти штучного інтелекту — передові моделі (frontier models), моделі змішаної експертизи (MoE) та агентні сценарії, де багато GPU повинні працювати як один обчислювальний домен. У таких задачах слабким місцем часто є обмін даними між відеокартами, і комплексний підхід з різними типами компонентів в одній системі покликаний закривати цей недолік. 

NVIDIA Rubin CPX: вузькоспеціалізована AI-архітектура

Rubin CPX — спеціалізований AI-прискорювач NVIDIA, створений для інференсу з дуже довгим контекстом. Це вже не універсальна GPU, а вузькопрофільний чип з оптимізованою архітектурою та програмною складовою. 

Rubin CPX має використовуватися там, де AI-модель повинна тримати напоготові великий обсяг контексту. Для кодингових агентів це може бути репозиторій, для генерації відео — довга послідовність кадрів, а для  корпоративного RAG — велика база документів. 

Характеристики AI-процесора NVIDIA:

Архітектура NVIDIA Rubin
Тип GPU GPU для інференсу з дуже довгим контекстом
Пам’ять 128 GB GDDR7
Продуктивність в AI-обчисленнях До 30 PFLOPS NVFP4
Обробка довгого контексту До 3× швидше проти GB300 NVL72
Система Vera Rubin NVL144 CPX
З’єднання з іншими GPU та стійками Quantum-X800 InfiniBand або Spectrum-X Ethernet
Мережа ConnectX-9 SuperNIC
Основні задачі Аналіз великих кодових баз, генерація відео, обробка документів і AI-запитів із дуже довгим контекстом

NVIDIA Rubin CPX GPU to feature 128GB GDDR7 memory, launches end of 2026

Source: https://www.tweaktown.com/news/107645/nvidia-rubin-cpx-gpu-to-feature-128gb-gddr7-memory-launches-end-of-2026/index.html

Чому це важливо для AI: у майбутніх NVIDIA AI Factories обчислювальні кластери мають розділятися за функціональністю й призначенням для підвищення продуктивності та енергоефективності. Чип Rubin CPX повинен закривати саме контекстну фазу інференсу. Він важливий для майбутніх AI-сервісів, де вартість і швидкість відповіді залежатимуть від того, як система працює з довгим контекстом.

NVIDIA Rubin Ultra: нове покоління для великих AI-кластерів

  • Орієнтовна дата виходу: III–IV квартал 2027 року.
  • Джерела даних: технічний блог виробника
  • Головна перевага: концепція NVIDIA AI Factory реалізується через об’єднання 8 стійок по 72 GPU в єдину високопродуктивну систему. Це спрощує побудову кластерів та розширює можливості їх комунікації в мережі. 

NVIDIA Rubin Ultra базується на тій самій архітектурі. Головна відмінність — нові зв’язки між стійками на базі мідних дротів та оптичних ліній. Це зменшує затримки в обробці даних і збільшує загальну продуктивність масштабних дата-центрів з GPU NVIDIA, 

Інші дані — поки з розряду чуток і непідтверджених інсайдів. Зокрема, WCFTech публікує такі прогнози:

  • компоновка з 1 чи 2 чипами на платі. Кожен матиме по 2 чиплета (раніше були чутки про 4-чиплетну схему, але вони не підтвердилися);
  • до 768 ГБ або 1 ТБ пам’яті HBM4E на плату з пропускної здатністю 22 ТБ/с;
  • TDP 1800 або 2300 Вт. 

nvidia Vera Rubin Ultra NVL576 in 2H27 600 kW per rack 4 GPUs per package  HBM4e NVLink7

Source: https://x.com/IanCutress/status/1902067320912277936

Чому це важливо для AI: Rubin Ultra — це інфраструктура NVIDIA для великих мовних моделей у глобальних масштабах. Ця серія графічних адаптерів дозволяє швидше проєктувати великі AI-кластери на базі типових стійкових конфігурацій. Але її мінус полягає в тому, що масштабування бізнесу в такому форматі стає менш гнучким і доступним — потрібні великі інвестиції у саме обладнання, живлення, охолодження, системи безпеки. 

NVIDIA Feynman GPU: замкнена AI-екосистема 

  • Орієнтовна дата виходу: 2028 рік, найбільш ймовірно — друга половина. 
  • Джерела даних: GTC-анонс
  • Головна перевага: компанія готується продавати блочні дата-центри NVIDIA для ШІ. Feynman має охоплювати всі ключові процеси роботи із штучним інтелектом — обчислення, зберігання інформації, комунікації та захист даних. 

NVIDIA Feynman GPU — комплексне рішення NVIDIA для генеративного ШІ та інших видів штучного інтелекту. Воно розвиває повну екосистему навколо відеокарт, дозволяючи замовляти комплектацію дата-центрів «під ключ». 

Ідея не в тому, щоб продавати окремий GPU, а в тому, щоб постачати набір сумісних компонентів для обчислень, пам’яті, мережі, сховищ і захисту даних. Для великих дата-центрів це спрощує проєктування системи, бо ключові компоненти створюються в одній екосистемі. Але є й зворотний бік: чим більше рівнів інфраструктури закриває один виробник, тим складніше бізнесу буде комбінувати обладнання різних вендорів, змінювати платформу або виходити з екосистеми без великих витрат.

Згідно з NVIDIA roadmap 2028, для Feynman найважливішими будуть швидкість передачі даних, стабільність пам’яті, масштабування між стійками, енергоефективність і захист інфраструктури. У цій архітектурі компанія продовжує зміщення пріоритетів з чистої обчислювальної потужності відеокарт до прикладної продуктивності в конкретних задачах.

NVIDIA to Tap TSMC's A16 Node for "Feynman" GPUs | TechPowerUp

Source: https://www.techpowerup.com/341011/nvidia-to-tap-tsmcs-a16-node-for-feynman-gpus

Чому це важливо для AI: формування замкненої екосистеми спрощує запуск нових моделей штучного інтелекту та сервісів на їх базі. Такий підхід зменшить витрати часу й ресурсів на створення IT-інфраструктури для великого технологічного бізнесу. 

NVIDIA GeForce RTX 6000: майбутнє геймінгу під питанням

На відміну від AI-чипів, майбутні відеокарти NVIDIA у споживацькому сегменті так і не були анонсовані в першій половині 2026 року. Очікується, що перша інформація про них з’явиться на початку 2027, постачання почнуться у другій половині року, а стабільні роздрібні продажі — ближче до 2028. 

Компанія також не розкриває дані про графічні чипи NVIDIA 2028 року. Інсайдери стверджують, що нове покоління відеокарт буде побудовано на архітектурі Rubin з 3-нм техпроцесом. Очікується, що в операціях з трасуванням променів (RT) та інтелектуальним масштабуванням (DLSS) їх продуктивність збільшиться на 100% в порівнянні з поколінням Blackwell. В інших сценаріях приріст потужності буде меншим — близько 30–35%. 

YouTube-канал RedGamingTech також наводить очікувані характеристики на основі витоків інформації:

  • GeForce RTX 6090 — 192 потокових мультипроцесори, 24+ тисяч ядер CUDA, частота в діапазоні 2–3 ГГц, 32 ГБ пам’яті GDDR7, 512-бітна шина. 
  • GeForce RTX 6080 — 20 ГБ пам’яті, 320-бітна шина. 
  • GeForce RTX 6070 — 16 ГБ пам’яті, 256-бітна шина. 

Варто зазначити: дані не мають офіційного підтвердження, тож їх не варто використовувати для планування майбутніх покупок. 

Якщо ці витоки підтвердяться, нові відеокарти можуть отримати тензорні ядра 6 покоління та ядра трасування променів 5 покоління. Для них можуть бути доступні певні технології штучного інтелекту NVIDIA, які раніше використовувалися лише в професійних моделях, тож топові моделі краще поводитимуться в AI-пайплайнах. 

Висновок: що показує дорожня карта NVIDIA

Технічні плани компанії показують головний напрямок її розвитку — перехід від універсальних відеокарт до спеціалізованих чипів NVIDIA для штучного інтелекту, а також від окремих плат до комплектних стійок і блочних дата-центрів. Виробник націлюється на глобальне лідерство у сегменті AI та хоче забезпечувати своїх клієнтів простішою, зручнішою та зрозумілішою в плані економіки експлуатації продукцією.