Gemini dostáva Lyria 3 model na generovanie hudby z textu, obrázka alebo videa |
V beta verzii aplikácie Gemini pribudol model Lyria 3, ktorý generuje 30-sekundové skladby z textu aj obrázka či videa.
Google rozširuje možnosti aplikácie Gemini o generovanie hudby. V beta verzii do nej pribudol model Lyria 3 od Google DeepMind, ktorý dokáže vytvoriť 30-sekundové skladby na základe textového zadania alebo nahranej fotografie či videa.
Používateľ stačí opísať náladu, žáner alebo konkrétnu situáciu a Gemini vygeneruje krátku skladbu s textom alebo inštrumentálnu verziu. Text piesne už netreba zadávať samostatne, model ho vytvorí automaticky podľa zadania. Novinkou je aj väčšia kontrola nad štýlom, tempom či typom vokálu a realistickejší, hudobne komplexnejší výstup oproti starším verziám Lyria.
Hudbu je možné vytvárať dvomi spôsobmi:
- Text → skladba: používateľ popíše žáner, náladu alebo spomienku a dostane 30-sekundový track.
- Obrázok/video → skladba: po nahratí obsahu Gemini vytvorí hudbu a text podľa vizuálnej atmosféry.
Každá skladba má vlastný obal generovaný nástrojom Nano Banana a je možné ju jednoducho stiahnuť alebo zdieľať odkazom. Google zdôrazňuje, že cieľom nie je vytvárať profesionálne hudobné diela, ale ponúknuť rýchly a kreatívny spôsob sebavyjadrenia.
Lyria 3 sa dostáva aj do služby YouTube Dream Track, kde má zlepšiť kvalitu zvukovej stopy pre Shorts videá. Je to zatiaľ čisto služba pre US, ale postupne sa sprístupňuje tvorcom aj do ďalších krajín.
Z hľadiska overovania obsahu Google pridáva audio podporu pre systém SynthID, teda neviditeľný vodoznak pre identifikáciu AI generovaného obsahu. Používateľ môže nahrať súbor a požiadať Gemini o kontrolu, či bol vytvorený pomocou Google AI.
Google uvádza, že model bol trénovaný s ohľadom na autorské práva a dohody s partnermi. Lyria 3 je určená na tvorbu originálnej hudby, nie na napodobňovanie konkrétnych interpretov. Ak používateľ uvedie meno umelca, výstup má vychádzať len zo všeobecnej inšpirácie štýlom alebo náladou. K dispozícii sú aj filtre proti prílišnému podobaniu sa existujúcim dielam.
Hudobné generovanie je dostupné používateľom vo veku 18+ v jazykoch angličtina, nemčina, španielčina, francúzština, hindčina, japončina, kórejčina a portugalčina. Funkcia sa spúšťa najskôr na desktopovej verzii Gemini, mobilná aplikácia ju dostane v priebehu niekoľkých dní. Predplatitelia Google AI Plus, Pro a Ultra majú vyššie limity generovania.
| NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA |
- RECENZIA: I Am Jesus Christ 137
- Vývoj GTA VI zrejme stál viac ako tri miliardy dolárov 103
- V Číne zažili kolaps ceny DDR5 pamätí, zlacneli aj o 30% za jeden deň 28
- Warhorse má podľa zákulisných informácií pracovať na open-world hre zo sveta Pána 44
- RECENZIA: Scott Pilgrim EX 2
- RECENZIA: Starship Troopers: Ultimate Bug War! 11
- GeForce RTX 60 Rubin plánuje dvojnásobný výkon ray-tracingu a tretinový rast raste 86
- Prvý pohľad na Mega Geometry zeleň s path tracingom vo Witcherovi 4 62
- Prvoaprílové žarty 8
- Ceny RAM pamätí postupne mierne klesajú 28 zobraziť viac článkov >













