Google predstavilo Gemma 4 - nový open AI model, ktorý môže bežať lokálne aj na RTX grafikách a mobiloch |
Google uviedol open modelovú rodinu Gemma 4 s multimodalitou, dlhým kontextom a podporou lokálneho behu na mobiloch aj RTX GPU.
Google ohlásil Gemma 4, novú generáciu open modelov, ktoré nemajú mieriť len do cloudu, ale aj priamo do zariadení používateľov. Firma pri nich zdôrazňuje lokálne nasadenie, multimodalitu, dlhý kontext a nasadenie pre agentické úlohy, teda aj pre AI nástroje, ktoré dokážu pracovať s funkciami, štruktúrovaným výstupom či viackrokovými úlohami. Google zároveň hovorí o tom, že ide o jeho doteraz najvýkonnejšie open modely, pričom ich chce dostať od mobilov a edge zariadení až po výkonnejšie PC a pracovné stanice.
Do hry sa hneď zapojila aj Nvidia, ktorá potvrdila optimalizácie pre RTX PC, DGX Spark aj Jetson Orin Nano. Gemma 4 sa tak od štartu profiluje ako modelová rodina určená nielen pre serverové nasadenie, ale aj pre lokálnu AI na spotrebiteľskom hardvéri. Nvidia ju priamo spája s trendom personalizovaných agentických AI nástrojov, ktoré bežia lokálne a pracujú s kontextom používateľa bez nutnosti neustáleho presunu dát do cloudu.
Verzie modelov
Google vydal štyri hlavné verzie Gemma 4:
- Gemma 4 E2B (4GB)
najmenší model určený hlavne pre mobilné a edge zariadenia - Gemma 4 E4B (6GB)
výkonnejší malý model pre lokálne AI použitie - Gemma 4 26B A4B (17GB)
Mixture-of-Experts verzia určená na náročnejšie reasoning úlohy a agentické workflow - Gemma 4 31B (19GB)
najväčší dense model v rodine, určený pre výkonnejší lokálny hardvér vrátane RTX GPU a pracovných staníc
Google pri modeloch uvádza, že menšie verzie E2B a E4B cielia na čo najefektívnejšie lokálne spustenie, zatiaľ čo 26B A4B a 31B sú určené na výkonnejšie nasadenie, coding, reasoning a agentické scenáre.
Hlavné výhody Gemma 4
- Open modely s open weights a licenciou Apache 2.0 pre komerčné aj vývojárske nasadenie
- Lokálne použitie od mobilov cez edge zariadenia až po RTX PC
- Multimodalita, teda podpora textu a obrazu, pričom menšie modely podporujú aj audio
- Dlhý kontext až do 256-tisíc tokenov pri väčších modeloch
- Function calling a štruktúrovaný výstup, čo je dôležité pre agentické workflow
- Podpora širokého ekosystému nástrojov, vrátane Ollama, llama.cpp, vLLM, Hugging Face a Google AI Edge Gallery
Google zároveň tvrdí, že Gemma 4 ponúka veľmi vysoký výkon vzhľadom na veľkosť modelov. Pri vydaní vyzdvihol najmä to, že nové modely sú stavané na advanced reasoning a agentické workflow, pričom 31B aj 26B patria medzi najsilnejšie open modely vo svojej kategórii.
Nvidia tlačí Gemma 4 na RTX grafiky
Druhý veľký smer je lokálne AI na PC. Nvidia hneď po vydaní oznámila, že Gemma 4 je optimalizovaná pre jej hardvér, vrátane RTX PC, pracovných staníc, DGX Spark a Jetson modulov. V praxi to má znamenať lepší výkon pri lokálnom spúšťaní modelov, vyšší throughput a nižšiu latenciu vďaka Tensor Core akcelerácii a CUDA softvérovému stacku.
Nvidia zároveň spomína day-one podporu cez Ollama, llama.cpp a vLLM, pričom Unsloth ponúka optimalizované a kvantizované verzie na lokálne nasadenie a doladenie modelov. Gemma 4 sa tak pri štarte neopiera len o papierové parametre, ale aj o už pripravený softvérový ekosystém pre reálne použitie.
Gemma 4 mieri aj na mobily
Jednou z najzaujímavejších vecí na Gemme 4 je to, že Google ju netlačí len ako model pre silné počítače. Menšie verzie E2B a E4B sú od začiatku určené aj pre mobilné a edge zariadenia a Google ich sprístupnil aj cez aplikáciu Google AI Edge Gallery. V praxi to znamená, že model sa dá stiahnuť a používať priamo v mobile, bez potreby cloudového backendu.
To potvrdzujú aj prvé ukážky z praxe, kde používatelia skúšajú Gemma 4 E2B priamo na Pixeloch. Google zároveň vo vývojárskom blogu ukazuje, že AI Edge Gallery a LiteRT-LM majú slúžiť ako základ pre lokálne agentické funkcie na zariadeniach s Androidom aj iOS.
You can run Google new Gemma 4 on mobile easily.
- AshutoshShrivastava (@ai_for_success) April 2, 2026
I am using Gemma 4 version E2B on my Pixel 10 Pro.
Here is all you need to do:
- Go to the App Store and install Google AI Edge Gallery. If you already have it, just update it.
- From there, you can install the model directly and… pic.twitter.com/7jtzWPaJPS
Čo je na Gemme 4 dôležité?
Gemma 4 je dôležitá najmä tým, že ukazuje ďalší posun open modelov smerom k lokálnej AI. Google ju nepredstavil len ako alternatívu ku cloudovým službám, ale ako modelovú rodinu, ktorá má fungovať naprieč viacerými triedami zariadení. Od mobilov, cez edge moduly až po RTX zostavy chce pokryť scenáre, kde AI beží priamo u používateľa, pracuje s jeho lokálnym kontextom a nemusí byť neustále pripojená ku cloudu.
Práve v tom je jej hlavný odkaz. Google už nechce len ukázať nový open model, ale naznačuje, že ďalšia vlna AI sa bude stále viac presúvať priamo do zariadení. Gemma 4 má byť jedným z modelov, ktoré tento posun potiahnu.
Ak si Gemmu chcete vyskúšať lokálne, tak najlepšie stiahnuť LM Studio a následne priamo v ňom niektorý Gemma 4 model, ale verziu vyberajte podľa veľkosti pamäte vašej grafiky. Dostupný je aj v Android Studiu.
| NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA |
- GTA 6 má dostať aj pokročilý systém procedurálne rozbíjateľného skla 37
- V Číne zažili kolaps ceny DDR5 pamätí, zlacneli aj o 30% za jeden deň 28
- RECENZIA: I Am Jesus Christ 113
- Vývoj GTA VI zrejme stál viac ako tri miliardy dolárov 103
- Sony zvyšuje ceny PS5, PS5 Pro a PlayStation Portal 197
- Warhorse má podľa zákulisných informácií pracovať na open-world hre zo sveta Pána 44
- GeForce RTX 60 Rubin plánuje dvojnásobný výkon ray-tracingu a tretinový rast raste 86
- Ceny RAM pamätí postupne mierne klesajú 28
- RECENZIA: Starship Troopers: Ultimate Bug War! 10
- RECENZIA: Heroes of Science and Fiction 7 zobraziť viac článkov >












