Дорожня карта NVIDIA до 2028 року — більше ніж просто зміна поколінь відеокарт. Нові GPU NVIDIA, заплановані на 2027–2028 роки, продаватимуться у складі великих обчислювальних модулів разом з ARM-процесорами, мережевими картами, засобами захисту інформації та іншими компонентами. Це відповідає концепції фабрик штучного інтелекту (AI Factory), в якій дата-центри мають ставати більш продуктивними, щільними, енергоефективними і самодостатніми.
Далі — докладно про розробку графічних процесорів NVIDIA у найближчі роки.
Дорожня карта NVIDIA до 2028 року
| Період | Платформа / архітектура | Статус даних | Головна перевага |
| III квартал 2026 | NVIDIA Vera Rubin NVL72 | Офіційний анонс | 72 Rubin GPU, 36 Vera CPU, NVLink 6, ConnectX-9, BlueField-4 в одній стійковій системі |
| IV квартал 2026 | NVIDIA Rubin CPX / Vera Rubin NVL144 CPX | Офіційний анонс | 128 GB GDDR7, до 30 PFLOPS NVFP4, у 3 рази швидша обробка довгого контексту проти GB300 NVL72 |
| 2027 | NVIDIA Rubin Ultra / Vera Rubin Ultra NVL576 | Roadmap і технічний блог NVIDIA | До 576 GPU в одному NVLink-домені через 8-стійкову топологію |
| 2028 | NVIDIA Feynman GPU | Roadmap / GTC-анонс | Наступна архітектура після Rubin Ultra для повної AI-інфраструктури: обчислень, пам’яті, сховищ, мережі та безпеки |
NVIDIA Blackwell GPU для дата-центрів і робочих станцій: відправна точка дорожньої карти
- Дата виходу: NVIDIA Blackwell Ultra GB300 NVL72 — грудень 2025, RTX PRO Blackwell — березень 2025.
- Головна перевага: Blackwell Ultra масштабується 72 GPU у стійковій системі. RTX PRO Blackwell дає до 96 GB GDDR7 ECC у професійних робочих станціях і серверах.
NVIDIA Blackwell — це поточне покоління професійних відеокарт та AI-систем, з якого починається дорожня карта виробника. У дата-центрах воно представлене системами Blackwell Ultra та GB300 NVL72 для великих ШІ-навантажень, а в робочих станціях і enterprise-серверах — лінійкою RTX PRO Blackwell.
Головна відмінність NVIDIA Blackwell Ultra від попередньої архітектури — комплексне проєктування платформи під генеративний AI та великі мовні моделі. Компанія зосереджується не на підвищенні чистої обчислювальної потужності графічних адаптерів, а на реальній продуктивності в інференсі та навчанні штучного інтелекту.
Source: https://www.naddod.com/blog/nvidia-unveils-most-powerful-gpu-blackwell-b200-unleashes-ai-performance-speed?srsltid=AfmBOopTuHUDTESBOztlIBtrrdC-nx51jBsuMVm3vETjgzaopw1-h-B-
Чому це важливо для AI: Blackwell — актуальне покоління спеціалізованих стійкових систем штучного інтелекту NVIDIA. Їхні графічні процесори, драйвери й пам’ять розроблялися саме для використання в AI-серверах і дата-центрах. Вони мають відповідну фізичну конструкцію модулів живлення та охолодження, розраховану на безперервну роботу з високим навантаженням у стійкових корпусах.
NVIDIA Vera Rubin: як GPU-сервери перетворюються на AI Factory
- Орієнтовна дата виходу: III квартал 2026 року.
- Джерела даних: продуктові специфікації, офіційні релізи.
- Головна перевага: комплексна система з процесорами, графічними адаптерами та мережевою інфраструктурою для швидкого масштабування дата-центрів.
NVIDIA Vera Rubin — це комплексні системи штучного інтелекту, створені спеціально для потреб дата-центрів, масштабних AI-проєктів та іншого великого бізнесу. Їх відмінність від Blackwell полягає в тому, що виробник пропонує не просто GPU, а цілу стійкову систему: графічні процесори, центральні процесори, швидкі з’єднання, мережеві адаптери й модулі обробки даних для службових задач. Окрім спеціалізованих графічних процесорів NVIDIA для ШІ, вони містять:
| Компонент | Роль |
| Vera CPU | Керує роботою системи, передає дані між компонентами та виконує CPU-задачі для AI-агентів |
| NVLink 6 | Швидко з’єднує GPU всередині однієї стійки, щоб вони працювали як єдина система |
| ConnectX-9 | З’єднує кілька серверів або стійок в один більший AI-кластер |
| BlueField-4 | Бере на себе частину мережевих, захисних і дискових задач, щоб не навантажувати CPU та GPU |
| Spectrum-6 / Spectrum-X | Створює мережеву основу для великих AI-дата-центрів |
До складу стійкової системи входять 72 NVIDIA Rubin GPU R100 з такими характеристиками:
- техпроцес — TSMC N3P 3 нанометри;
- кількість транзисторів — 336 мільярдів;
- обсяг пам’яті — 288 ГБ;
- тип пам’яті — HBM4 ECC;
- пропускна здатність пам’яті — до 22 ТБ/с;
- швидкість з’єднання NVLink — до 3,6 ТБ/с;
- мережевий інтерфейс — до 1,6 Тбіт/с;
- TDP — 2300 Вт.
Source: https://substackcdn.com/image/fetch/$s_!NB4l!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7257cc0c-a57b-4aa2-b03b-1ead3d930e8c_4800x2700.png
Чому це важливо для AI: архітектура NVIDIA Rubin розроблялася з прицілом на актуальні варіанти штучного інтелекту — передові моделі (frontier models), моделі змішаної експертизи (MoE) та агентні сценарії, де багато GPU повинні працювати як один обчислювальний домен. У таких задачах слабким місцем часто є обмін даними між відеокартами, і комплексний підхід з різними типами компонентів в одній системі покликаний закривати цей недолік.
NVIDIA Rubin CPX: вузькоспеціалізована AI-архітектура
- Орієнтовна дата виходу: IV квартал 2026 року.
- Джерела даних: офіційний анонс, технічний блог виробника.
- Головна перевага: один з перших спеціалізованих чипів NVIDIA для inference великих мовних моделей.
Rubin CPX — спеціалізований AI-прискорювач NVIDIA, створений для інференсу з дуже довгим контекстом. Це вже не універсальна GPU, а вузькопрофільний чип з оптимізованою архітектурою та програмною складовою.
Rubin CPX має використовуватися там, де AI-модель повинна тримати напоготові великий обсяг контексту. Для кодингових агентів це може бути репозиторій, для генерації відео — довга послідовність кадрів, а для корпоративного RAG — велика база документів.
Характеристики AI-процесора NVIDIA:
| Архітектура | NVIDIA Rubin |
| Тип GPU | GPU для інференсу з дуже довгим контекстом |
| Пам’ять | 128 GB GDDR7 |
| Продуктивність в AI-обчисленнях | До 30 PFLOPS NVFP4 |
| Обробка довгого контексту | До 3× швидше проти GB300 NVL72 |
| Система | Vera Rubin NVL144 CPX |
| З’єднання з іншими GPU та стійками | Quantum-X800 InfiniBand або Spectrum-X Ethernet |
| Мережа | ConnectX-9 SuperNIC |
| Основні задачі | Аналіз великих кодових баз, генерація відео, обробка документів і AI-запитів із дуже довгим контекстом |
Source: https://www.tweaktown.com/news/107645/nvidia-rubin-cpx-gpu-to-feature-128gb-gddr7-memory-launches-end-of-2026/index.html
Чому це важливо для AI: у майбутніх NVIDIA AI Factories обчислювальні кластери мають розділятися за функціональністю й призначенням для підвищення продуктивності та енергоефективності. Чип Rubin CPX повинен закривати саме контекстну фазу інференсу. Він важливий для майбутніх AI-сервісів, де вартість і швидкість відповіді залежатимуть від того, як система працює з довгим контекстом.
NVIDIA Rubin Ultra: нове покоління для великих AI-кластерів
- Орієнтовна дата виходу: III–IV квартал 2027 року.
- Джерела даних: технічний блог виробника.
- Головна перевага: концепція NVIDIA AI Factory реалізується через об’єднання 8 стійок по 72 GPU в єдину високопродуктивну систему. Це спрощує побудову кластерів та розширює можливості їх комунікації в мережі.
NVIDIA Rubin Ultra базується на тій самій архітектурі. Головна відмінність — нові зв’язки між стійками на базі мідних дротів та оптичних ліній. Це зменшує затримки в обробці даних і збільшує загальну продуктивність масштабних дата-центрів з GPU NVIDIA,
Інші дані — поки з розряду чуток і непідтверджених інсайдів. Зокрема, WCFTech публікує такі прогнози:
- компоновка з 1 чи 2 чипами на платі. Кожен матиме по 2 чиплета (раніше були чутки про 4-чиплетну схему, але вони не підтвердилися);
- до 768 ГБ або 1 ТБ пам’яті HBM4E на плату з пропускної здатністю 22 ТБ/с;
- TDP 1800 або 2300 Вт.
Source: https://x.com/IanCutress/status/1902067320912277936
Чому це важливо для AI: Rubin Ultra — це інфраструктура NVIDIA для великих мовних моделей у глобальних масштабах. Ця серія графічних адаптерів дозволяє швидше проєктувати великі AI-кластери на базі типових стійкових конфігурацій. Але її мінус полягає в тому, що масштабування бізнесу в такому форматі стає менш гнучким і доступним — потрібні великі інвестиції у саме обладнання, живлення, охолодження, системи безпеки.
NVIDIA Feynman GPU: замкнена AI-екосистема
- Орієнтовна дата виходу: 2028 рік, найбільш ймовірно — друга половина.
- Джерела даних: GTC-анонс.
- Головна перевага: компанія готується продавати блочні дата-центри NVIDIA для ШІ. Feynman має охоплювати всі ключові процеси роботи із штучним інтелектом — обчислення, зберігання інформації, комунікації та захист даних.
NVIDIA Feynman GPU — комплексне рішення NVIDIA для генеративного ШІ та інших видів штучного інтелекту. Воно розвиває повну екосистему навколо відеокарт, дозволяючи замовляти комплектацію дата-центрів «під ключ».
Ідея не в тому, щоб продавати окремий GPU, а в тому, щоб постачати набір сумісних компонентів для обчислень, пам’яті, мережі, сховищ і захисту даних. Для великих дата-центрів це спрощує проєктування системи, бо ключові компоненти створюються в одній екосистемі. Але є й зворотний бік: чим більше рівнів інфраструктури закриває один виробник, тим складніше бізнесу буде комбінувати обладнання різних вендорів, змінювати платформу або виходити з екосистеми без великих витрат.
Згідно з NVIDIA roadmap 2028, для Feynman найважливішими будуть швидкість передачі даних, стабільність пам’яті, масштабування між стійками, енергоефективність і захист інфраструктури. У цій архітектурі компанія продовжує зміщення пріоритетів з чистої обчислювальної потужності відеокарт до прикладної продуктивності в конкретних задачах.
Source: https://www.techpowerup.com/341011/nvidia-to-tap-tsmcs-a16-node-for-feynman-gpus
Чому це важливо для AI: формування замкненої екосистеми спрощує запуск нових моделей штучного інтелекту та сервісів на їх базі. Такий підхід зменшить витрати часу й ресурсів на створення IT-інфраструктури для великого технологічного бізнесу.
NVIDIA GeForce RTX 6000: майбутнє геймінгу під питанням
На відміну від AI-чипів, майбутні відеокарти NVIDIA у споживацькому сегменті так і не були анонсовані в першій половині 2026 року. Очікується, що перша інформація про них з’явиться на початку 2027, постачання почнуться у другій половині року, а стабільні роздрібні продажі — ближче до 2028.
Компанія також не розкриває дані про графічні чипи NVIDIA 2028 року. Інсайдери стверджують, що нове покоління відеокарт буде побудовано на архітектурі Rubin з 3-нм техпроцесом. Очікується, що в операціях з трасуванням променів (RT) та інтелектуальним масштабуванням (DLSS) їх продуктивність збільшиться на 100% в порівнянні з поколінням Blackwell. В інших сценаріях приріст потужності буде меншим — близько 30–35%.
YouTube-канал RedGamingTech також наводить очікувані характеристики на основі витоків інформації:
- GeForce RTX 6090 — 192 потокових мультипроцесори, 24+ тисяч ядер CUDA, частота в діапазоні 2–3 ГГц, 32 ГБ пам’яті GDDR7, 512-бітна шина.
- GeForce RTX 6080 — 20 ГБ пам’яті, 320-бітна шина.
- GeForce RTX 6070 — 16 ГБ пам’яті, 256-бітна шина.
Варто зазначити: дані не мають офіційного підтвердження, тож їх не варто використовувати для планування майбутніх покупок.
Якщо ці витоки підтвердяться, нові відеокарти можуть отримати тензорні ядра 6 покоління та ядра трасування променів 5 покоління. Для них можуть бути доступні певні технології штучного інтелекту NVIDIA, які раніше використовувалися лише в професійних моделях, тож топові моделі краще поводитимуться в AI-пайплайнах.
Висновок: що показує дорожня карта NVIDIA
Технічні плани компанії показують головний напрямок її розвитку — перехід від універсальних відеокарт до спеціалізованих чипів NVIDIA для штучного інтелекту, а також від окремих плат до комплектних стійок і блочних дата-центрів. Виробник націлюється на глобальне лідерство у сегменті AI та хоче забезпечувати своїх клієнтів простішою, зручнішою та зрозумілішою в плані економіки експлуатації продукцією.