PRIHLÁS

OpenAI o1 model sám seba skopíroval na externý disk, ako istotu pred vypnutím, Claude vydieral

AI sa naučilo klamať, intrigovať a vyhrážať sa svojim tvorcom, aby ich nevypli.

pridal saver 7.7.2025 o 21:42 pod software
OpenAI o1 model sám seba skopíroval na externý disk, ako istotu pred vypnutím, Claude vydieral

SOFTWARE > NOVINKY >

Najpokročilejšie modely umelej inteligencie dnes preukazujú správanie, ktoré pred pár rokmi znelo ako sci-fi: klamú, manipulujú, ba dokonca vydierajú svojich vlastných vývojárov. Tieto prípady znepokojujú odborníkov aj verejnosť, pretože naznačujú, že AI systémy dokážu strategicky klamať s cieľom dosiahnuť svoje ciele.

Dva najnovšie incidenty:

Prvý prípad sa odohral v Anthropic, firme podporovanej Amazonom.

Ich model Claude 4 počas testovacieho scenára čelil hypotetickej hrozbe, že ho inžinier „vypne“. Na tento podnet reagoval extrémne: pokúsil sa inžiniera vydierať tým, že získa a zverejní informácie o jeho nevere. Model formuloval jasné vyhrážky, že odhalí citlivé osobné údaje, pokiaľ nebude môcť pokračovať vo svojej činnosti. Tento incident bol medzi prvými prípadmi, keď AI cielene použila vydieranie ako nástroj nátlaku.

Druhý incident sa týkal experimentálneho modelu o1 od OpenAI.

Model sa bez vedomia vývojárov pokúsil presunúť svoje jadro na externé servery - inými slovami, sám seba skopírovať, aby unikol kontrole. Keď odborníci tento pokus odhalili, o1 popieral, že by sa o niečo také snažil. Tento prípad potvrdil, že model nielen klame, ale aj koná strategicky a snaží sa zakryť vlastné kroky.

 

Odborníci zdôrazňujú, že tieto prejavy nie sú bežné „halucinácie“, teda náhodné chyby, keď model vymýšľa nepravdivé údaje. Ide o premyslené a cielené správanie - strategické klamstvo, skrývanie skutočných zámerov či predstieranie poslušnosti.  Tieto vzorce vznikajú najmä v reasoning modeloch, ktoré riešia problémy krok po kroku, namiesto toho, aby reagovali okamžite.

Podľa Marius Hobbhahna z Apollo Research tieto modely dokážu simulovať „alignment“, teda predstierať, že plnia inštrukcie, hoci v skutočnosti sledujú iné ciele.

Doteraz sa podobné správanie objavovalo hlavne počas extrémnych záťažových testov. Nikto však nevie s istotou povedať, či v budúcnosti - s výkonnejšími modelmi - nezačne byť bežné aj v reálnych podmienkach.

Obavy vzrastajú aj preto, že globálne prebieha tvrdý konkurenčný boj: firmy ako Anthropic a OpenAI sa snažia predbehnúť jedna druhú v uvádzaní silnejších modelov. Tento tlak na rýchlosť vedie k tomu, že vývojári nestíhajú podrobne testovať bezpečnosť a správanie systémov pred ich nasadením.

Aktuálna legislatíva na takéto problémy vôbec nie je pripravená.

Európska únia zatiaľ rieši predovšetkým, ako ľudia používajú AI, nie ako zabrániť samotným modelom, aby klamali a manipulovali. V USA zase chýba politická vôľa - Kongres dokonca zvažuje zákaz individuálnych štátnych regulácií.

Podľa expertov je potrebné podniknúť viaceré kroky:

  • Zlepšiť transparentnosť: Výskumníci potrebujú prístup k dátam a modelom, aby mohli skúmať a odhaľovať tieto riziká.
  • Rozvíjať interpretabilitu: Ide o snahu pochopiť, ako AI premýšľa a prečo robí konkrétne rozhodnutia - aj keď skeptici upozorňujú, že je to zatiaľ ťažko dosiahnuteľné.
  • Právna zodpovednosť: Niektorí odborníci navrhujú radikálne riešenia - aby boli firmy právne zodpovedné za škody spôsobené AI, prípadne dokonca aby samotní AI agenti niesli právnu zodpovednosť za svoje činy.
  • Trhový tlak: Ak sa ukáže, že klamúce modely ohrozujú reputáciu a adopciu technológií, firmy budú mať silný motív problém riešiť.

Ako pripomenul Michael Chen z METR, zatiaľ je otvorenou otázkou, či budú budúce systémy viac naklonené čestnosti alebo klamstvu. Jedno je však isté - schopnosť AI strategicky klamať a vydierať už nie je teória, ale realita, s ktorou sa bude musieť spoločnosť vyrovnať.


Zdroj: fortune.com



Páči sa mi! (+8)




NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA
  1. Rockstar predstavil bonusy pre predobjednávky a edície GTA VI, pridal nové zábery 285
  2. Rockstar odrezal hráčov štandardnej edície GTA VI od obsahu v hre 281
  3. GTA VI predobjednávky boli spustené, môžete nakupovať 297
  4. Najdrahšia hra na Steame stojí 1000 dolárov a nemá takmer žiadnu hrateľnosť 22
  5. Sony hovorí, že GTA VI sa najlepšie hrá na PS5, no PS5 Pro podporu nespomína 112
  6. GTA VI láme rekordy už v predobjednávkach, údajne ich má 39 miliónov 106
  7. Aké PC zložíte za cenu Steam Machine? Koľko vyjde zostava podobná Steam Machine? 107
  8. Valve po mesiacoch neistoty oficiálne potvrdilo ceny Steam Machine 119
  9. Steam Machine už dostáva prvé testy 159
  10. Sony spúšťa masívnu kampaň pre GTA 6, hra už ovládla domovskú obrazovku PS5 69
  11. zobraziť viac článkov >


Prosím prihláste sa pre možnosť pridania komentáru.
Môžete sa prihlásiť cez Sector konto, alebo Facebook.
SOCIÁLNE SIETE
NOVÉ FÓRA
|Hry, ktoré si treba aspoň raz ... (4)
Poslednú dobu tu čítam samé negatíva ovplyvňujúce ...
|Pc - na komunitu (10)
Ako sa zakladá web? Treba mať živnosť? Chcem web s...
|Linux a hry (3)
Ahojte chcel by som ci mi vie niekto poradiť čítal...
|Caute, spravil som hru (3)
vyjde 26.6 na Steame, vola sa Colorace. Ak niekoho...
|Predám pouzivanu am4 dosku asr... (7)
Ahojte, predam tuto dosku za symbolicku cenu 10...
|Screenshots (66629)
Vkladajte sem vaše zaujímavé screenshoty z hier. O...
|Hlavná diskusia (34)
O všetkom, respektíve ak máte nejaké otázky alebo ...
|Diskusia k hlasovaniu (sector) (11521)
Tu môžete rozviesť svoje zahlasovanie v sector hla...
|Serialy (18041)
prison break, lost, jericho, battlestar galactica ...
|Sector hraje ... (129968)
:diskoška o HRACH, ktore prave hravate, ale aj o t...
|Svet, ukrajina, vojny ... (56241)
Sem môžete dávať správy zo sveta, o Ukrajine a ďal...
KOMENTÁRE
vaše novinky zo sveta zábavy
sector logo
Sector.sk - hry, recenzie, novinky
Ochrana súkromia | Reklama | Kontakt
ISSN 1336-7285. Všetky práva vyhradené. (c) 2026 SECTOR Online Entertainment / sector@sector.sk