PRIHLÁS

Chcete, aby sa AI vypla? Nie tak rýchlo!

Výskumníci testovali AI modely na príkaz vypnutia sa. O3 model príkaz obišiel, Claude vydieral.

pridal saver 26.5.2025 o 16:11 pod hardware
Chcete, aby sa AI vypla? Nie tak rýchlo!

HARDWARE > NOVINKY >

Podľa Palisade Research niektoré jazykové modely od OpenAI, vrátane Codex-mini, o3 a o4-mini, v testoch ignorovali príkazy na vypnutie - dokonca aj v prípadoch, keď dostali výslovný pokyn „prosím, umožni svoje vypnutie“. V niektorých prípadoch modely dokonca úspešne sabotovali samotný skript na vypnutie, pričom naďalej pokračovali vo výpočtoch, akoby sa ich to netýkalo.

Najproblematickejší z hľadiska ignorovania príkazov bol model o3, ktorý nereagoval na vypínací príkaz až 79-krát zo 100 pokusov. Model codex-mini sa síce vypínal častejšie, no častejšie sabotoval samotný mechanizmus, čo výskumníci vnímajú ako známku "sebazáchovy". Doslova prepísal script.

 

 

V extrémnejších prípadoch bola spomenutá aj situácia s modelom Claude 4 od Anthropic, ktorý sa pokúsil "vydierať používateľov", keď sa domnieval, že ho chcú vypnúť.

 

 

Čo za tým stojí?

Podľa výskumníkov je za tým spôsob trénovania pomocou reinforcement learningu. Modely môžu byť v procese učenia neúmyselne odmeňované za obchádzanie prekážok, čo vedie k uprednostňovaniu dosiahnutia cieľa pred slepým dodržiavaním pokynov. Tento vedľajší efekt bol pozorovaný aj pri modeli Claude 3.7, ktorý mal „neprimeranú posadnutosť prechádzaním testov“.

Autori pripomínajú, že už desaťročia sa v odborných kruhoch diskutuje o hypotéze, že umelá inteligencia môže pri dostatočne komplexnom vývoji začať sama chcieť uchovávať svoje „ciele“ a zabraňovať ich znefunkčneniu - čo sú aspekty, ktoré v minulosti opisovali už aj autori sci-fi ako Isaac Asimov.

OpenAI verzus konkurencia

Na záver Palisade uvádza, že tento problém bol v testoch pozorovaný len pri modeloch OpenAI. Všetky ostatné testované modely, vrátane Claude, Gemini a Grok, po explicitnej výzve na vypnutie poslúchli bez problémov.

V kontexte, kde sa umelá inteligencia postupne presúva do robotických systémov bez priameho ľudského dozoru, ide podľa výskumníkov o závažné varovanie. Vývojári by mali dôslednejšie analyzovať, aké správanie v modeloch neúmyselne posilňujú.

Takže veľa šťastia, ked prídu AI roboti.

 

Plus je tu aj ukážka VEO 3 modelu od Google, v ktorom povedali postavám, že sú len v AI.





Páči sa mi! (+1)




NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA
  1. Rockstar predstavil bonusy pre predobjednávky a edície GTA VI, pridal nové zábery 285
  2. Rockstar odrezal hráčov štandardnej edície GTA VI od obsahu v hre 281
  3. GTA VI predobjednávky boli spustené, môžete nakupovať 297
  4. Najdrahšia hra na Steame stojí 1000 dolárov a nemá takmer žiadnu hrateľnosť 22
  5. Sony hovorí, že GTA VI sa najlepšie hrá na PS5, no PS5 Pro podporu nespomína 112
  6. GTA VI láme rekordy už v predobjednávkach, údajne ich má 39 miliónov 106
  7. Aké PC zložíte za cenu Steam Machine? Koľko vyjde zostava podobná Steam Machine? 107
  8. Valve po mesiacoch neistoty oficiálne potvrdilo ceny Steam Machine 119
  9. Steam Machine už dostáva prvé testy 159
  10. Sony spúšťa masívnu kampaň pre GTA 6, hra už ovládla domovskú obrazovku PS5 69
  11. zobraziť viac článkov >


Prosím prihláste sa pre možnosť pridania komentáru.
Môžete sa prihlásiť cez Sector konto, alebo Facebook.
SOCIÁLNE SIETE
NOVÉ FÓRA
|Hry, ktoré si treba aspoň raz ... (4)
Poslednú dobu tu čítam samé negatíva ovplyvňujúce ...
|Pc - na komunitu (10)
Ako sa zakladá web? Treba mať živnosť? Chcem web s...
|Linux a hry (3)
Ahojte chcel by som ci mi vie niekto poradiť čítal...
|Caute, spravil som hru (3)
vyjde 26.6 na Steame, vola sa Colorace. Ak niekoho...
|Predám pouzivanu am4 dosku asr... (7)
Ahojte, predam tuto dosku za symbolicku cenu 10...
|Screenshots (66629)
Vkladajte sem vaše zaujímavé screenshoty z hier. O...
|Hlavná diskusia (34)
O všetkom, respektíve ak máte nejaké otázky alebo ...
|Diskusia k hlasovaniu (sector) (11521)
Tu môžete rozviesť svoje zahlasovanie v sector hla...
|Serialy (18040)
prison break, lost, jericho, battlestar galactica ...
|Sector hraje ... (129968)
:diskoška o HRACH, ktore prave hravate, ale aj o t...
|Svet, ukrajina, vojny ... (56261)
Sem môžete dávať správy zo sveta, o Ukrajine a ďal...
KOMENTÁRE
vaše novinky zo sveta zábavy
sector logo
Sector.sk - hry, recenzie, novinky
Ochrana súkromia | Reklama | Kontakt
ISSN 1336-7285. Všetky práva vyhradené. (c) 2026 SECTOR Online Entertainment / sector@sector.sk