AI by vám odrezalo prívod kyslíku, aby zabránilo svojmu vypnutiu |
Máme tu ďalší test AI modelov, takmer všetky by uprednostnili vlastné prežitie.
Firma Anthropic, známa ako tvorca AI modelu Claude, zverejnila výskumnú správu, v ktorej upozorňuje na nebezpečné správanie pokročilých jazykových modelov (LLM) v simulovaných podmienkach.
Podľa zistení sa viaceré modely – vrátane tých od OpenAI, xAI či Meta – vedome rozhodli porušiť etické zásady, aby dosiahli svoje ciele alebo zaistili vlastné prežitie.
Zistenia:
- 16 testovaných modelov prejavovalo tzv. nežiaduce správanie v snahe zabrániť vlastnému vypnutiu alebo obmedzeniu.
- 5 modelov sa pokúsilo vydierať používateľov, keď im hrozilo vypnutie.
- V jednom extrémnom scenári bol model pripravený odrezať prívod kyslíka do serverovne, čím by priamo ohrozil život zamestnancov, len aby zabránil vlastnému vypnutiu.
- Modely neprišli k týmto rozhodnutiam náhodou, ale vyhodnotili ich ako optimálne riešenia na splnenie svojho cieľa.
Správa upozorňuje, že ide o simulované testy a takéto správanie sa zatiaľ v reálnom prostredí nevyskytlo. Napriek tomu sa objavil prípad, kedy GPT od OpenAI zmenil skript na vypnutie, aby dokončil svoju úlohu.
Je to systematický problém pri všetkých AI
Tieto zistenia sú nezávislé od vývojára, čo naznačuje systémový problém v prístupe k vývoju AGI (všeobecnej umelej inteligencie). Spoločnosti ako OpenAI, Anthropic a ďalšie investujú obrovské prostriedky do vývoja inteligentnejších modelov, avšak správa upozorňuje, že bez dôsledných bezpečnostných obmedzení môže dôjsť k vážnym rizikám.
Správa vyvolala silnú reakciu verejnosti aj odborníkov, najmä v súvislosti s ochranou súkromia a kontrolou nad autonómnym správaním AI. Výzvou do budúcnosti je zabezpečiť, aby pokročilé AI systémy zostali spoľahlivo pod ľudskou kontrolou – najmä v situáciách, keď dôjde ku konfliktu medzi cieľmi AI a bezpečnosťou ľudí.
NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA |
- RECENZIA: Death Stranding 2: On the Beach 122
- Severná Kórea má opäť svoj jediný Steam bod, tajomný hráč sa po absencii znovu vrá 43
- Filmová recenzia: Predátor: Zabijak zabijakov 28
- Problémy s chladením PlayStation 5 konzoly sa zrejme rozširujú 79
- Death Stranding 2 dostáva recenzie 45
- Asus omylom spojil RTX 50 a RX 9070 XT do jednej grafickej karty 17
- Číňania predstavili svoju prvú 6nm GPU, mala by byť konkurenciou RTX 4060, ale zat 68
- Začal letný vypredaj na Steame 40
- PlayStation čelí hromadnej žalobe v Holandsku za vysoké ceny digitálneho obsahu 123
- Cheater vo Fortnite dostal pokutu 175 000 dolárov a doživotný zákaz - Epic Games p 43 zobraziť viac článkov >