PRIHLÁS

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Najvyššia Vera Rubin bude mať cez 20TB pamäte.

pridal saver 17.3.2026 o 10:02 pod hardware
NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

HARDWARE > NOVINKY >

NVIDIA na GTC 2026 predstavila novú generáciu AI dátacentrovej infraštruktúry s názvom Vera Rubin. Nejde pritom len o ďalší výpočtový čip, ale o širšiu platformu zloženú z viacerých typov procesorov, prepínačov, storage riešení a rackových konfigurácií. Firma s ňou cieli nielen na tréning veľkých modelov, ale čoraz výraznejšie aj na inferenciu, teda samotné nasadzovanie a prevádzku AI modelov.

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Novinka stojí na Rubin GPU a Vera CPU, no dopĺňajú ich aj ďalšie časti ako ConnectX-9, BlueField-4, NVLink 6 Switch, Spectrum-X CPO a tiež Groq 3 LPU. Práve zapojenie Groqu je jednou z najzaujímavejších zmien, keďže NVIDIA tým priznáva, že chce silnejšie preniknúť aj do segmentu inference workloadov, kde doteraz nebola vždy najrýchlejšia alebo najefektívnejšia.

Podľa Jensena Huanga má Vera Rubin predstavovať ďalší veľký krok v AI infraštruktúre. NVIDIA pritom hovorí o obrovskom raste výpočtového výkonu za poslednú dekádu a zároveň naznačuje, že trh sa začína presúvať z tréningu modelov k inferencii. Práve to má byť dôvod, prečo firma skladá celú platformu ako širší systém a nie len ako samostatné GPU.

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Rubin GPU a Vera CPU ako základ platformy

Základom novej generácie je Rubin GPU. Čip využíva dve veľké reticle-sized jadrá a osem HBM4 puzdier. NVIDIA pri ňom zdôrazňuje nielen kapacitu pamäte, ale aj veľmi vysokú priepustnosť a výkon v AI výpočtoch. Rubin má zároveň tvoriť stavebný kameň od samostatných kariet až po celé rackové riešenia.

Vera CPU má zasa podľa prezentácie ponúknuť vysoký jednovláknový výkon, vysokú dátovú priepustnosť a dobrú energetickú efektivitu. Zaujímavé je nasadenie LPDDR5X pamäte, čo je v dátacentrovom segmente menej tradičný prístup. NVIDIA zároveň naznačuje, že Vera nebude viazaná len na platformu Vera Rubin, ale chce ju ponúkať aj samostatne..

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Vera Rubin nie je len čip, ale celý systém

Celá platforma je rozdelená do viacerých častí. Okrem hlavného compute trayu s Rubin GPU a Vera CPU tu NVIDIA zaradila aj NVLink Switch tray pre škálovanie, BlueField-4 STX storage platformu, ethernetové riešenia Spectrum a tiež hybridné inference moduly s Groq akcelerátormi.

Firma upravila aj fyzickú konštrukciu dátacentrových modulov. Compute tray je kompletne kvapalinovo chladený a používa horúcu vodu s teplotou 45 stupňov Celzia. NVIDIA tvrdí, že nový systém montáže má výrazne zjednodušiť nasadenie rackov a skrátiť čas inštalácie dátacentra.

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Groq ako nový prvok v boji o inferenciu

Veľkou novinkou je hybridný modul Groq 3 LPX. Ten obsahuje osem Groq 3 LPU jednotiek a má byť navrhnutý pre vysokorýchlostnú inferenciu, hlavne pri veľkých modeloch a pri úlohách citlivých na latenciu. NVIDIA týmto krokom reaguje na rastúci význam inferencie, kde sa presadzujú aj špecializované riešenia od iných firiem.

Podľa prezentácie majú Rubin GPU a Groq LPU spolu pokrývať rôzne fázy inferencie. Rubin má riešiť prefill, teda spracovanie vstupného kontextu, zatiaľ čo Groq má pomáhať pri decode fáze, teda pri samotnom generovaní odpovedí. Práve kombinácia oboch typov akcelerátorov má zvýšiť efektivitu pri veľkých modeloch, dlhých kontextových oknách a pri prevádzke v reálnom čase.

NVIDIA pri tomto riešení uvádza až 35-násobný nárast inference throughputu na megawatt. To je zároveň jeden z hlavných argumentov, prečo Groq zapadá do platformy Vera Rubin. Firma už teda nechce dominovať len v tréningu, ale aj v praktickej prevádzke AI služieb.

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

NVIDIA vidí veľký rast príjmov z AI infraštruktúry

S predstavením Vera Rubin prišlo aj širšie obchodné posolstvo. Jensen Huang uviedol, že AI priemysel vstupuje do bodu zlomu, keď sa pozornosť presúva z tréningu na inferenciu. Práve to má vytvoriť ďalšiu obrovskú vlnu dopytu po výpočtovej infraštruktúre.

NVIDIA podľa prezentácie očakáva, že príjmy z compute segmentu môžu medzi rokmi 2025 až 2027 prekročiť 1 bilión dolárov. Firma to spája s rastom hyperscalerov, cloudových služieb, investícií do sovereign AI v Európe a na Blízkom východe aj s dopytom od veľkých AI laboratórií.

Jensen zároveň tvrdí, že nároky na výpočty v AI mali za posledné dva roky narásť až miliónnásobne. Ako jeden z nepriamych signálov spomenul aj rast spot cien starších GPU ako Ampere a Hopper, čo má naznačovať pokračujúci nedostatok výpočtovej kapacity na trhu.

NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu

Vera Rubin NVL72 bude mať 20.7 TB HBM 4 pamäte

Ak by ste sa pýtali, kam miznú kapacity moderných pamätí, odpoveď je aj tu. Najväčšia zostava Vera Rubin NVL72 ponúkne 20,7 TB HBM4, takže len samotná GPU pamäť je v jednom serveri rádovo vyššia než RAM v bežnom PC. 

  • Jeden tak server má 646-krát viac pamäte ako 32GB v PC.  

Popri tom firma pripravuje aj menšie konfigurácie. Vera Rubin Superchip spája dve Rubin GPU a jeden Vera CPU. Samostatný Rubin GPU bude zasa základom pre ďalšie produkty a partnerov. Vera CPU má navyše vzniknúť aj v samostatnom 256-CPU racku.

Špecifikácie:

  • Rubin GPU prinesie 288 GB HBM4, priepustnosť 22 TB/s a výkon do 50 PFLOPS pri NVFP4 inferencii. Menší Superchip spojí dve tieto GPU s jedným Vera CPU a ponúkne 576 GB HBM4 aj 100 PFLOPS pri inferencii.
  • Najväčšia zostava Vera Rubin NVL72 postaví na 72 GPU Rubin a 36 CPU Vera. NVIDIA pri nej uvádza 3600 PFLOPS pri inferencii, 20,7 TB HBM4 a 260 TB/s cez NVLink.
  • Do inferencie zároveň zapojí aj Groq 3 LPU. Jeden čip má ponúknuť 500 MB SRAM a 1,2 PFLOPS vo FP8, pričom kombinácia Rubin + Groq LPX má dosahovať až 315 PFLOPS inference výkonu.

Vera Rubin ukazuje, že NVIDIA už nechce hovoriť len o novej generácii GPU. Buduje kompletnú AI infraštruktúru od procesorov a pamätí cez optické prepojenia a storage až po špecializované inference akcelerátory. Práve zapojenie Groqu pritom naznačuje, že ďalší boj sa nebude viesť len o tréning modelov, ale aj o to, kto zvládne inferenciu rýchlejšie, lacnejšie a s nižšou spotrebou.

Ak bol Blackwell veľký krok v AI akcelerácii, Vera Rubin pôsobí skôr ako pokus postaviť okolo AI celý nový dátacentrový ekosystém.





Páči sa mi!







Prosím prihláste sa pre možnosť pridania komentáru.
Môžete sa prihlásiť cez Sector konto, alebo Facebook.
SOCIÁLNE SIETE
NOVÉ FÓRA
|Herný monitor aoc agon pro cs2... (0)
zdravim, neviem ci pisem do spravnej temy, ,predam...
|Hladam hocikoho kto ma xbox ko... (0)
Zdravim, hladam niekoho, kto ma xbox a bol by ocho...
|Akú hodnotu majú ddr4 (12)
Kingston FURY 128 GB KIT DDR4 3200 MHz CL16 Beast ...
|Ovládače (gamepady) (2)
Všetko o ovládačoch, aké máte, chceli by ste, tipy...
|Nvidia a kvalita ovladacov (24)
Ja len, ze ked sa tu vsade pise o tej bozej nvidii...
|Screenshots (65787)
Vkladajte sem vaše zaujímavé screenshoty z hier. O...
|Must see (42193)
Su veci ktore sa slovami opisat nedaju a preto pat...
|Čo vas dnes nasr... nahnevalo ... (44920)
Opozitum temy co vas dnes potesilo , takze sem sa ...
|Sector hraje ... (129065)
:diskoška o HRACH, ktore prave hravate, ale aj o t...
|Serialy (17833)
prison break, lost, jericho, battlestar galactica ...
|Svet, ukrajina, vojny ... (52555)
Sem môžete dávať správy zo sveta, o Ukrajine a ďal...
vaše novinky zo sveta zábavy
sector logo
Sector.sk - hry, recenzie, novinky
Ochrana súkromia | Reklama | Kontakt
ISSN 1336-7285. Všetky práva vyhradené. (c) 2026 SECTOR Online Entertainment / sector@sector.sk