Як NVIDIA планує розробку своїх графічних процесорів та систем штучного інтелекту до 2028 року

18 червня 2026

Дорожня карта NVIDIA до 2028 року — більше ніж просто зміна поколінь відеокарт. Нові GPU NVIDIA, заплановані на 2027–2028 роки, продаватимуться у складі великих обчислювальних модулів разом з ARM-процесорами, мережевими картами, засобами захисту інформації та іншими компонентами. Це відповідає концепції фабрик штучного інтелекту (AI Factory), в якій дата-центри мають ставати більш продуктивними, щільними, енергоефективними і самодостатніми.

Купити GPU сервер

Далі — докладно про розробку графічних процесорів NVIDIA у найближчі роки.

Дорожня карта NVIDIA до 2028 року

Період	Платформа / архітектура	Статус даних	Головна перевага
III квартал 2026	NVIDIA Vera Rubin NVL72	Офіційний анонс	72 Rubin GPU, 36 Vera CPU, NVLink 6, ConnectX-9, BlueField-4 в одній стійковій системі
IV квартал 2026	NVIDIA Rubin CPX / Vera Rubin NVL144 CPX	Офіційний анонс	128 GB GDDR7, до 30 PFLOPS NVFP4, у 3 рази швидша обробка довгого контексту проти GB300 NVL72
2027	NVIDIA Rubin Ultra / Vera Rubin Ultra NVL576	Roadmap і технічний блог NVIDIA	До 576 GPU в одному NVLink-домені через 8-стійкову топологію
2028	NVIDIA Feynman GPU	Roadmap / GTC-анонс	Наступна архітектура після Rubin Ultra для повної AI-інфраструктури: обчислень, пам’яті, сховищ, мережі та безпеки

NVIDIA Blackwell GPU для дата-центрів і робочих станцій: відправна точка дорожньої карти

Дата виходу: NVIDIA Blackwell Ultra GB300 NVL72 — грудень 2025, RTX PRO Blackwell — березень 2025.
Головна перевага: Blackwell Ultra масштабується 72 GPU у стійковій системі. RTX PRO Blackwell дає до 96 GB GDDR7 ECC у професійних робочих станціях і серверах.

NVIDIA Blackwell — це поточне покоління професійних відеокарт та AI-систем, з якого починається дорожня карта виробника. У дата-центрах воно представлене системами Blackwell Ultra та GB300 NVL72 для великих ШІ-навантажень, а в робочих станціях і enterprise-серверах — лінійкою RTX PRO Blackwell.

Головна відмінність NVIDIA Blackwell Ultra від попередньої архітектури — комплексне проєктування платформи під генеративний AI та великі мовні моделі. Компанія зосереджується не на підвищенні чистої обчислювальної потужності графічних адаптерів, а на реальній продуктивності в інференсі та навчанні штучного інтелекту.

Source: https://www.naddod.com/blog/nvidia-unveils-most-powerful-gpu-blackwell-b200-unleashes-ai-performance-speed?srsltid=AfmBOopTuHUDTESBOztlIBtrrdC-nx51jBsuMVm3vETjgzaopw1-h-B-

Чому це важливо для AI: Blackwell — актуальне покоління спеціалізованих стійкових систем штучного інтелекту NVIDIA. Їхні графічні процесори, драйвери й пам’ять розроблялися саме для використання в AI-серверах і дата-центрах. Вони мають відповідну фізичну конструкцію модулів живлення та охолодження, розраховану на безперервну роботу з високим навантаженням у стійкових корпусах.

NVIDIA Vera Rubin: як GPU-сервери перетворюються на AI Factory

Орієнтовна дата виходу: III квартал 2026 року.
Джерела даних: продуктові специфікації, офіційні релізи.
Головна перевага: комплексна система з процесорами, графічними адаптерами та мережевою інфраструктурою для швидкого масштабування дата-центрів.

NVIDIA Vera Rubin — це комплексні системи штучного інтелекту, створені спеціально для потреб дата-центрів, масштабних AI-проєктів та іншого великого бізнесу. Їх відмінність від Blackwell полягає в тому, що виробник пропонує не просто GPU, а цілу стійкову систему: графічні процесори, центральні процесори, швидкі з’єднання, мережеві адаптери й модулі обробки даних для службових задач. Окрім спеціалізованих графічних процесорів NVIDIA для ШІ, вони містять:

Компонент	Роль
Vera CPU	Керує роботою системи, передає дані між компонентами та виконує CPU-задачі для AI-агентів
NVLink 6	Швидко з’єднує GPU всередині однієї стійки, щоб вони працювали як єдина система
ConnectX-9	З’єднує кілька серверів або стійок в один більший AI-кластер
BlueField-4	Бере на себе частину мережевих, захисних і дискових задач, щоб не навантажувати CPU та GPU
Spectrum-6 / Spectrum-X	Створює мережеву основу для великих AI-дата-центрів

До складу стійкової системи входять 72 NVIDIA Rubin GPU R100 з такими характеристиками:

техпроцес — TSMC N3P 3 нанометри;
кількість транзисторів — 336 мільярдів;
обсяг пам’яті — 288 ГБ;
тип пам’яті — HBM4 ECC;
пропускна здатність пам’яті — до 22 ТБ/с;
швидкість з’єднання NVLink — до 3,6 ТБ/с;
мережевий інтерфейс — до 1,6 Тбіт/с;
TDP — 2300 Вт.

Source: https://substackcdn.com/image/fetch/$s_!NB4l!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F7257cc0c-a57b-4aa2-b03b-1ead3d930e8c_4800x2700.png

Чому це важливо для AI: архітектура NVIDIA Rubin розроблялася з прицілом на актуальні варіанти штучного інтелекту — передові моделі (frontier models), моделі змішаної експертизи (MoE) та агентні сценарії, де багато GPU повинні працювати як один обчислювальний домен. У таких задачах слабким місцем часто є обмін даними між відеокартами, і комплексний підхід з різними типами компонентів в одній системі покликаний закривати цей недолік.

NVIDIA Rubin CPX: вузькоспеціалізована AI-архітектура

Орієнтовна дата виходу: IV квартал 2026 року.
Джерела даних: офіційний анонс, технічний блог виробника.
Головна перевага: один з перших спеціалізованих чипів NVIDIA для inference великих мовних моделей.

Rubin CPX — спеціалізований AI-прискорювач NVIDIA, створений для інференсу з дуже довгим контекстом. Це вже не універсальна GPU, а вузькопрофільний чип з оптимізованою архітектурою та програмною складовою.

Rubin CPX має використовуватися там, де AI-модель повинна тримати напоготові великий обсяг контексту. Для кодингових агентів це може бути репозиторій, для генерації відео — довга послідовність кадрів, а для корпоративного RAG — велика база документів.

Характеристики AI-процесора NVIDIA:

Архітектура	NVIDIA Rubin
Тип GPU	GPU для інференсу з дуже довгим контекстом
Пам’ять	128 GB GDDR7
Продуктивність в AI-обчисленнях	До 30 PFLOPS NVFP4
Обробка довгого контексту	До 3× швидше проти GB300 NVL72
Система	Vera Rubin NVL144 CPX
З’єднання з іншими GPU та стійками	Quantum-X800 InfiniBand або Spectrum-X Ethernet
Мережа	ConnectX-9 SuperNIC
Основні задачі	Аналіз великих кодових баз, генерація відео, обробка документів і AI-запитів із дуже довгим контекстом

Source: https://www.tweaktown.com/news/107645/nvidia-rubin-cpx-gpu-to-feature-128gb-gddr7-memory-launches-end-of-2026/index.html

Чому це важливо для AI: у майбутніх NVIDIA AI Factories обчислювальні кластери мають розділятися за функціональністю й призначенням для підвищення продуктивності та енергоефективності. Чип Rubin CPX повинен закривати саме контекстну фазу інференсу. Він важливий для майбутніх AI-сервісів, де вартість і швидкість відповіді залежатимуть від того, як система працює з довгим контекстом.

NVIDIA Rubin Ultra: нове покоління для великих AI-кластерів

Орієнтовна дата виходу: III–IV квартал 2027 року.
Джерела даних: технічний блог виробника.
Головна перевага: концепція NVIDIA AI Factory реалізується через об’єднання 8 стійок по 72 GPU в єдину високопродуктивну систему. Це спрощує побудову кластерів та розширює можливості їх комунікації в мережі.

NVIDIA Rubin Ultra базується на тій самій архітектурі. Головна відмінність — нові зв’язки між стійками на базі мідних дротів та оптичних ліній. Це зменшує затримки в обробці даних і збільшує загальну продуктивність масштабних дата-центрів з GPU NVIDIA,

Інші дані — поки з розряду чуток і непідтверджених інсайдів. Зокрема, WCFTech публікує такі прогнози:

компоновка з 1 чи 2 чипами на платі. Кожен матиме по 2 чиплета (раніше були чутки про 4-чиплетну схему, але вони не підтвердилися);
до 768 ГБ або 1 ТБ пам’яті HBM4E на плату з пропускної здатністю 22 ТБ/с;
TDP 1800 або 2300 Вт.

Source: https://x.com/IanCutress/status/1902067320912277936

Чому це важливо для AI: Rubin Ultra — це інфраструктура NVIDIA для великих мовних моделей у глобальних масштабах. Ця серія графічних адаптерів дозволяє швидше проєктувати великі AI-кластери на базі типових стійкових конфігурацій. Але її мінус полягає в тому, що масштабування бізнесу в такому форматі стає менш гнучким і доступним — потрібні великі інвестиції у саме обладнання, живлення, охолодження, системи безпеки.

NVIDIA Feynman GPU: замкнена AI-екосистема

Орієнтовна дата виходу: 2028 рік, найбільш ймовірно — друга половина.
Джерела даних: GTC-анонс.
Головна перевага: компанія готується продавати блочні дата-центри NVIDIA для ШІ. Feynman має охоплювати всі ключові процеси роботи із штучним інтелектом — обчислення, зберігання інформації, комунікації та захист даних.

NVIDIA Feynman GPU — комплексне рішення NVIDIA для генеративного ШІ та інших видів штучного інтелекту. Воно розвиває повну екосистему навколо відеокарт, дозволяючи замовляти комплектацію дата-центрів «під ключ».

Ідея не в тому, щоб продавати окремий GPU, а в тому, щоб постачати набір сумісних компонентів для обчислень, пам’яті, мережі, сховищ і захисту даних. Для великих дата-центрів це спрощує проєктування системи, бо ключові компоненти створюються в одній екосистемі. Але є й зворотний бік: чим більше рівнів інфраструктури закриває один виробник, тим складніше бізнесу буде комбінувати обладнання різних вендорів, змінювати платформу або виходити з екосистеми без великих витрат.

Згідно з NVIDIA roadmap 2028, для Feynman найважливішими будуть швидкість передачі даних, стабільність пам’яті, масштабування між стійками, енергоефективність і захист інфраструктури. У цій архітектурі компанія продовжує зміщення пріоритетів з чистої обчислювальної потужності відеокарт до прикладної продуктивності в конкретних задачах.

Source: https://www.techpowerup.com/341011/nvidia-to-tap-tsmcs-a16-node-for-feynman-gpus

Чому це важливо для AI: формування замкненої екосистеми спрощує запуск нових моделей штучного інтелекту та сервісів на їх базі. Такий підхід зменшить витрати часу й ресурсів на створення IT-інфраструктури для великого технологічного бізнесу.

NVIDIA GeForce RTX 6000: майбутнє геймінгу під питанням

На відміну від AI-чипів, майбутні відеокарти NVIDIA у споживацькому сегменті так і не були анонсовані в першій половині 2026 року. Очікується, що перша інформація про них з’явиться на початку 2027, постачання почнуться у другій половині року, а стабільні роздрібні продажі — ближче до 2028.

Компанія також не розкриває дані про графічні чипи NVIDIA 2028 року. Інсайдери стверджують, що нове покоління відеокарт буде побудовано на архітектурі Rubin з 3-нм техпроцесом. Очікується, що в операціях з трасуванням променів (RT) та інтелектуальним масштабуванням (DLSS) їх продуктивність збільшиться на 100% в порівнянні з поколінням Blackwell. В інших сценаріях приріст потужності буде меншим — близько 30–35%.

YouTube-канал RedGamingTech також наводить очікувані характеристики на основі витоків інформації:

GeForce RTX 6090 — 192 потокових мультипроцесори, 24+ тисяч ядер CUDA, частота в діапазоні 2–3 ГГц, 32 ГБ пам’яті GDDR7, 512-бітна шина.
GeForce RTX 6080 — 20 ГБ пам’яті, 320-бітна шина.
GeForce RTX 6070 — 16 ГБ пам’яті, 256-бітна шина.

Варто зазначити: дані не мають офіційного підтвердження, тож їх не варто використовувати для планування майбутніх покупок.

Якщо ці витоки підтвердяться, нові відеокарти можуть отримати тензорні ядра 6 покоління та ядра трасування променів 5 покоління. Для них можуть бути доступні певні технології штучного інтелекту NVIDIA, які раніше використовувалися лише в професійних моделях, тож топові моделі краще поводитимуться в AI-пайплайнах.

Висновок: що показує дорожня карта NVIDIA

Технічні плани компанії показують головний напрямок її розвитку — перехід від універсальних відеокарт до спеціалізованих чипів NVIDIA для штучного інтелекту, а також від окремих плат до комплектних стійок і блочних дата-центрів. Виробник націлюється на глобальне лідерство у сегменті AI та хоче забезпечувати своїх клієнтів простішою, зручнішою та зрозумілішою в плані економіки експлуатації продукцією.

Поширити

Новий коментар

Увійти за допомогою