NVIDIA predstavila Vera Rubin, novú AI platformu, ktorá spája Rubin GPU, Vera CPU aj Groq akcelerátory a mieri na inferenciu |
Najvyššia Vera Rubin bude mať cez 20TB pamäte.
NVIDIA na GTC 2026 predstavila novú generáciu AI dátacentrovej infraštruktúry s názvom Vera Rubin. Nejde pritom len o ďalší výpočtový čip, ale o širšiu platformu zloženú z viacerých typov procesorov, prepínačov, storage riešení a rackových konfigurácií. Firma s ňou cieli nielen na tréning veľkých modelov, ale čoraz výraznejšie aj na inferenciu, teda samotné nasadzovanie a prevádzku AI modelov.
Novinka stojí na Rubin GPU a Vera CPU, no dopĺňajú ich aj ďalšie časti ako ConnectX-9, BlueField-4, NVLink 6 Switch, Spectrum-X CPO a tiež Groq 3 LPU. Práve zapojenie Groqu je jednou z najzaujímavejších zmien, keďže NVIDIA tým priznáva, že chce silnejšie preniknúť aj do segmentu inference workloadov, kde doteraz nebola vždy najrýchlejšia alebo najefektívnejšia.
Podľa Jensena Huanga má Vera Rubin predstavovať ďalší veľký krok v AI infraštruktúre. NVIDIA pritom hovorí o obrovskom raste výpočtového výkonu za poslednú dekádu a zároveň naznačuje, že trh sa začína presúvať z tréningu modelov k inferencii. Práve to má byť dôvod, prečo firma skladá celú platformu ako širší systém a nie len ako samostatné GPU.
Rubin GPU a Vera CPU ako základ platformy
Základom novej generácie je Rubin GPU. Čip využíva dve veľké reticle-sized jadrá a osem HBM4 puzdier. NVIDIA pri ňom zdôrazňuje nielen kapacitu pamäte, ale aj veľmi vysokú priepustnosť a výkon v AI výpočtoch. Rubin má zároveň tvoriť stavebný kameň od samostatných kariet až po celé rackové riešenia.
Vera CPU má zasa podľa prezentácie ponúknuť vysoký jednovláknový výkon, vysokú dátovú priepustnosť a dobrú energetickú efektivitu. Zaujímavé je nasadenie LPDDR5X pamäte, čo je v dátacentrovom segmente menej tradičný prístup. NVIDIA zároveň naznačuje, že Vera nebude viazaná len na platformu Vera Rubin, ale chce ju ponúkať aj samostatne..
Vera Rubin nie je len čip, ale celý systém
Celá platforma je rozdelená do viacerých častí. Okrem hlavného compute trayu s Rubin GPU a Vera CPU tu NVIDIA zaradila aj NVLink Switch tray pre škálovanie, BlueField-4 STX storage platformu, ethernetové riešenia Spectrum a tiež hybridné inference moduly s Groq akcelerátormi.
Firma upravila aj fyzickú konštrukciu dátacentrových modulov. Compute tray je kompletne kvapalinovo chladený a používa horúcu vodu s teplotou 45 stupňov Celzia. NVIDIA tvrdí, že nový systém montáže má výrazne zjednodušiť nasadenie rackov a skrátiť čas inštalácie dátacentra.
Groq ako nový prvok v boji o inferenciu
Veľkou novinkou je hybridný modul Groq 3 LPX. Ten obsahuje osem Groq 3 LPU jednotiek a má byť navrhnutý pre vysokorýchlostnú inferenciu, hlavne pri veľkých modeloch a pri úlohách citlivých na latenciu. NVIDIA týmto krokom reaguje na rastúci význam inferencie, kde sa presadzujú aj špecializované riešenia od iných firiem.
Podľa prezentácie majú Rubin GPU a Groq LPU spolu pokrývať rôzne fázy inferencie. Rubin má riešiť prefill, teda spracovanie vstupného kontextu, zatiaľ čo Groq má pomáhať pri decode fáze, teda pri samotnom generovaní odpovedí. Práve kombinácia oboch typov akcelerátorov má zvýšiť efektivitu pri veľkých modeloch, dlhých kontextových oknách a pri prevádzke v reálnom čase.
NVIDIA pri tomto riešení uvádza až 35-násobný nárast inference throughputu na megawatt. To je zároveň jeden z hlavných argumentov, prečo Groq zapadá do platformy Vera Rubin. Firma už teda nechce dominovať len v tréningu, ale aj v praktickej prevádzke AI služieb.
NVIDIA vidí veľký rast príjmov z AI infraštruktúry
S predstavením Vera Rubin prišlo aj širšie obchodné posolstvo. Jensen Huang uviedol, že AI priemysel vstupuje do bodu zlomu, keď sa pozornosť presúva z tréningu na inferenciu. Práve to má vytvoriť ďalšiu obrovskú vlnu dopytu po výpočtovej infraštruktúre.
NVIDIA podľa prezentácie očakáva, že príjmy z compute segmentu môžu medzi rokmi 2025 až 2027 prekročiť 1 bilión dolárov. Firma to spája s rastom hyperscalerov, cloudových služieb, investícií do sovereign AI v Európe a na Blízkom východe aj s dopytom od veľkých AI laboratórií.
Jensen zároveň tvrdí, že nároky na výpočty v AI mali za posledné dva roky narásť až miliónnásobne. Ako jeden z nepriamych signálov spomenul aj rast spot cien starších GPU ako Ampere a Hopper, čo má naznačovať pokračujúci nedostatok výpočtovej kapacity na trhu.
Vera Rubin NVL72 bude mať 20.7 TB HBM 4 pamäte
Ak by ste sa pýtali, kam miznú kapacity moderných pamätí, odpoveď je aj tu. Najväčšia zostava Vera Rubin NVL72 ponúkne 20,7 TB HBM4, takže len samotná GPU pamäť je v jednom serveri rádovo vyššia než RAM v bežnom PC.
- Jeden tak server má 646-krát viac pamäte ako 32GB v PC.
Popri tom firma pripravuje aj menšie konfigurácie. Vera Rubin Superchip spája dve Rubin GPU a jeden Vera CPU. Samostatný Rubin GPU bude zasa základom pre ďalšie produkty a partnerov. Vera CPU má navyše vzniknúť aj v samostatnom 256-CPU racku.
Špecifikácie:
- Rubin GPU prinesie 288 GB HBM4, priepustnosť 22 TB/s a výkon do 50 PFLOPS pri NVFP4 inferencii. Menší Superchip spojí dve tieto GPU s jedným Vera CPU a ponúkne 576 GB HBM4 aj 100 PFLOPS pri inferencii.
- Najväčšia zostava Vera Rubin NVL72 postaví na 72 GPU Rubin a 36 CPU Vera. NVIDIA pri nej uvádza 3600 PFLOPS pri inferencii, 20,7 TB HBM4 a 260 TB/s cez NVLink.
- Do inferencie zároveň zapojí aj Groq 3 LPU. Jeden čip má ponúknuť 500 MB SRAM a 1,2 PFLOPS vo FP8, pričom kombinácia Rubin + Groq LPX má dosahovať až 315 PFLOPS inference výkonu.
Vera Rubin ukazuje, že NVIDIA už nechce hovoriť len o novej generácii GPU. Buduje kompletnú AI infraštruktúru od procesorov a pamätí cez optické prepojenia a storage až po špecializované inference akcelerátory. Práve zapojenie Groqu pritom naznačuje, že ďalší boj sa nebude viesť len o tréning modelov, ale aj o to, kto zvládne inferenciu rýchlejšie, lacnejšie a s nižšou spotrebou.
Ak bol Blackwell veľký krok v AI akcelerácii, Vera Rubin pôsobí skôr ako pokus postaviť okolo AI celý nový dátacentrový ekosystém.
| NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA |
- Nové megazľavy spustené 30
- Slovenská hra Medieval od Cypronie prekonala crowdfundingový cieľ za jediný deň! 41
- Google Maps dostáva najväčší update za posledné desaťročie, pribudne aj Gemini 23
- RECENZIA: John Carpenter's Toxic Commando 22
- Súd so Sony o 2.7 miliardy dolárov práve začal - britská žaloba rieši ceny v PlayS 82
- Crimson Desert predstavil svoje požiadavky na PC, ROG Xbox Ally a aj rozlíšenia na 53
- Microsoft k 25. výročiu Xboxu vydá niektoré klasické hry 25
- Ruské štúdio pripravuje propagandistickú hru Ukrainian Warfare: Gostomel Heroes o 49
- Steam Machine mieri na 1080p a 30 fps pre verifikované hry 58
- RECENZIA: 1348 Ex Voto 16 zobraziť viac článkov >

















