Google predstavilo Gemma 4 - nový open AI model, ktorý môže bežať lokálne aj na RTX grafikách a mobiloch

Google uviedol open modelovú rodinu Gemma 4 s multimodalitou, dlhým kontextom a podporou lokálneho behu na mobiloch aj RTX GPU.

pridal saver 3.4.2026 o 11:54 pod hry

Google predstavilo Gemma 4 - nový open AI model, ktorý môže bežať lokálne aj na RTX grafikách a mobiloch

HRY > NOVINKY >

Google ohlásil Gemma 4, novú generáciu open modelov, ktoré nemajú mieriť len do cloudu, ale aj priamo do zariadení používateľov. Firma pri nich zdôrazňuje lokálne nasadenie, multimodalitu, dlhý kontext a nasadenie pre agentické úlohy, teda aj pre AI nástroje, ktoré dokážu pracovať s funkciami, štruktúrovaným výstupom či viackrokovými úlohami. Google zároveň hovorí o tom, že ide o jeho doteraz najvýkonnejšie open modely, pričom ich chce dostať od mobilov a edge zariadení až po výkonnejšie PC a pracovné stanice.

Do hry sa hneď zapojila aj Nvidia, ktorá potvrdila optimalizácie pre RTX PC, DGX Spark aj Jetson Orin Nano. Gemma 4 sa tak od štartu profiluje ako modelová rodina určená nielen pre serverové nasadenie, ale aj pre lokálnu AI na spotrebiteľskom hardvéri. Nvidia ju priamo spája s trendom personalizovaných agentických AI nástrojov, ktoré bežia lokálne a pracujú s kontextom používateľa bez nutnosti neustáleho presunu dát do cloudu.

Verzie modelov

Google vydal štyri hlavné verzie Gemma 4:

Gemma 4 E2B (4GB)
najmenší model určený hlavne pre mobilné a edge zariadenia
Gemma 4 E4B (6GB)
výkonnejší malý model pre lokálne AI použitie
Gemma 4 26B A4B (17GB)
Mixture-of-Experts verzia určená na náročnejšie reasoning úlohy a agentické workflow
Gemma 4 31B (19GB)
najväčší dense model v rodine, určený pre výkonnejší lokálny hardvér vrátane RTX GPU a pracovných staníc

Google pri modeloch uvádza, že menšie verzie E2B a E4B cielia na čo najefektívnejšie lokálne spustenie, zatiaľ čo 26B A4B a 31B sú určené na výkonnejšie nasadenie, coding, reasoning a agentické scenáre.

Hlavné výhody Gemma 4

Open modely s open weights a licenciou Apache 2.0 pre komerčné aj vývojárske nasadenie
Lokálne použitie od mobilov cez edge zariadenia až po RTX PC
Multimodalita, teda podpora textu a obrazu, pričom menšie modely podporujú aj audio
Dlhý kontext až do 256-tisíc tokenov pri väčších modeloch
Function calling a štruktúrovaný výstup, čo je dôležité pre agentické workflow
Podpora širokého ekosystému nástrojov, vrátane Ollama, llama.cpp, vLLM, Hugging Face a Google AI Edge Gallery

Google zároveň tvrdí, že Gemma 4 ponúka veľmi vysoký výkon vzhľadom na veľkosť modelov. Pri vydaní vyzdvihol najmä to, že nové modely sú stavané na advanced reasoning a agentické workflow, pričom 31B aj 26B patria medzi najsilnejšie open modely vo svojej kategórii.

Nvidia tlačí Gemma 4 na RTX grafiky

Druhý veľký smer je lokálne AI na PC. Nvidia hneď po vydaní oznámila, že Gemma 4 je optimalizovaná pre jej hardvér, vrátane RTX PC, pracovných staníc, DGX Spark a Jetson modulov. V praxi to má znamenať lepší výkon pri lokálnom spúšťaní modelov, vyšší throughput a nižšiu latenciu vďaka Tensor Core akcelerácii a CUDA softvérovému stacku.

Nvidia zároveň spomína day-one podporu cez Ollama, llama.cpp a vLLM, pričom Unsloth ponúka optimalizované a kvantizované verzie na lokálne nasadenie a doladenie modelov. Gemma 4 sa tak pri štarte neopiera len o papierové parametre, ale aj o už pripravený softvérový ekosystém pre reálne použitie.

Gemma 4 mieri aj na mobily

Jednou z najzaujímavejších vecí na Gemme 4 je to, že Google ju netlačí len ako model pre silné počítače. Menšie verzie E2B a E4B sú od začiatku určené aj pre mobilné a edge zariadenia a Google ich sprístupnil aj cez aplikáciu Google AI Edge Gallery. V praxi to znamená, že model sa dá stiahnuť a používať priamo v mobile, bez potreby cloudového backendu.

To potvrdzujú aj prvé ukážky z praxe, kde používatelia skúšajú Gemma 4 E2B priamo na Pixeloch. Google zároveň vo vývojárskom blogu ukazuje, že AI Edge Gallery a LiteRT-LM majú slúžiť ako základ pre lokálne agentické funkcie na zariadeniach s Androidom aj iOS.

You can run Google new Gemma 4 on mobile easily.
I am using Gemma 4 version E2B on my Pixel 10 Pro.

Here is all you need to do:
- Go to the App Store and install Google AI Edge Gallery. If you already have it, just update it.
- From there, you can install the model directly and… pic.twitter.com/7jtzWPaJPS
- AshutoshShrivastava (@ai_for_success) April 2, 2026

Čo je na Gemme 4 dôležité?

Gemma 4 je dôležitá najmä tým, že ukazuje ďalší posun open modelov smerom k lokálnej AI. Google ju nepredstavil len ako alternatívu ku cloudovým službám, ale ako modelovú rodinu, ktorá má fungovať naprieč viacerými triedami zariadení. Od mobilov, cez edge moduly až po RTX zostavy chce pokryť scenáre, kde AI beží priamo u používateľa, pracuje s jeho lokálnym kontextom a nemusí byť neustále pripojená ku cloudu.

Práve v tom je jej hlavný odkaz. Google už nechce len ukázať nový open model, ale naznačuje, že ďalšia vlna AI sa bude stále viac presúvať priamo do zariadení. Gemma 4 má byť jedným z modelov, ktoré tento posun potiahnu.

Ak si Gemmu chcete vyskúšať lokálne, tak najlepšie stiahnuť LM Studio a následne priamo v ňom niektorý Gemma 4 model, ale verziu vyberajte podľa veľkosti pamäte vašej grafiky. Dostupný je aj v Android Studiu.