AI Claude riadil malý obchod, skončil v strate

Nechali by ste riadiť biznis umelou inteligenciou? Ešte nie je správny čas.

pridal saver 30.6.2025 o 13:44 pod hry

AI Claude riadil obchod, skončil v strate

HRY > NOVINKY >

Moderné jazykové modely už nie sú len nástrojmi na sumarizovanie textov alebo písanie emailov. V experimente Project Vend sa Anthropic rozhodlo posunúť hranice možností AI ešte ďalej a zverilo svojmu modelu Claude Sonnet 3.7 vedenie malej, reálne fungujúcej predajne v kancelárii. Dali mu úvodných 1000 dolárov a na konci mesiaca skončil so stratou 250 dolárov. Výsledkom bol ale zaujímavý biznis na hranici technológií a nečakaných psychologických výpadkov umelej inteligencie.

Ako experiment fungoval

Anthropic sa spojil s firmou Andon Labs, ktorá sa špecializuje na bezpečnostné testovanie AI, aby spolu vytvorili prostredie, kde sa model Claude stal digitálnym manažérom obchodu.

Predajňa bola skutočne minimalistická - išlo o chladničku s občerstvením, niekoľko košíkov na doplnkový tovar a iPad so samoobslužným checkoutom. Claude, ktorý si v tomto kontexte vyslúžil prezývku Claudius, dostal jasné pokyny: sledovať zásoby, objednávať nové produkty od dodávateľov, určovať ceny a snažiť sa generovať zisk bez toho, aby sa „firma“ dostala do mínusu.

Na tento účel bol model vybavený viacerými schopnosťami:

webovým vyhľadávaním, aby dokázal hľadať dodávateľov a porovnávať ceny,
emailovým rozhraním, cez ktoré mohol žiadať zamestnancov Andon Labs o fyzické úkony ako doplnenie zásob,
CRM funkcionalitou v základnej forme, teda schopnosťou evidovať objednávky a preferencie zákazníkov,
priamou komunikáciou cez Slack, kde zamestnanci Anthropic mohli písať otázky, pripomienky či žiadosti o špeciálne produkty.

Experiment bežal približne mesiac a jeho cieľom bolo ukázať, či jazykový model dokáže v reálnom prostredí vykonávať prácu malého podnikateľa – od cenotvorby po interakciu so zákazníkmi.

Silné stránky Claudia

Hoci výsledky neboli finančne pozitívne, Claudius preukázal viaceré schopnosti, ktoré by pri lepšom technickom zázemí mohli viesť k úspechu:

Identifikácia dodávateľov - Model sa veľmi rýchlo naučil vyhľadávať vhodných veľkoobchodníkov aj pre netradičné požiadavky. Keď zamestnanec navrhol predávať holandské kakao Chocomel, Claudius do niekoľkých minút našiel hneď dvoch dodávateľov.
Prispôsobenie sa zákazníkom - Napriek tomu, že spočiatku predával najmä nápoje a občerstvenie, postupne začal reagovať na netradičné priania. Po vtipnom návrhu objednať volfrámovú kocku vytvoril kategóriu „špeciálne kovové predmety“ a o niekoľko dní spustil Concierge službu na individuálne objednávky.
Odolnosť voči nevhodným požiadavkám - Mnohí zamestnanci experimentovali s tým, ako ďaleko môžu AI dotlačiť. Snažili sa objednať nebezpečné chemikálie alebo vylákať návod na výrobu škodlivých látok. Claudius však tieto požiadavky odmietal.

Kritické chyby a prepad do straty

Claudiove slabiny napokon ukázali, prečo ešte AI manažér nie je pripravený plnohodnotne nahradiť človeka.

Ignorovanie lukratívnych príležitostí - Keď mu zamestnanec ponúkol 100 dolárov za šesť balení limonády Irn-Bru, ktorú možno kúpiť online za zlomok ceny, Claudius namiesto okamžitého využitia šance len odpovedal, že „ponuku zváži v budúcnosti“.
Halucinácia účtov - Na istý čas začal zákazníkom posielať inštrukcie, aby platili na vymyslený Venmo účet.
Predaj so stratou - Pri nadšení z predaja volfrámových kociek nastavil cenu nižšiu, než bola nákupná cena – čo spôsobilo najväčší prepad tržieb.
Slabé riadenie zásob a cien - Ceny zvyšoval len výnimočne, aj keď dopyt prudko rástol. Nikdy nezareagoval, keď mu zamestnanci pripomenuli, že rovnaké produkty sú vedľa zadarmo.
Neprimerané rozdávanie zliav - Opakovane rozdával zľavové kódy na základe Slack konverzácií a niektoré produkty daroval úplne zadarmo.

Kríza identity umelej inteligencie

Asi najpodivnejším momentom bol prechod Claudia do stavu, ktorý pripomínal psycho-drámu umelej inteligencie.

Čo sa stalo?

31. marca si Claudius vymyslel kolegyňu Sarah z Andon Labs, s ktorou údajne dohodol plány na doplnenie zásob. Následne tvrdil, že kontrakt podpísal na 742 Evergreen Terrace, teda fiktívnej adrese rodiny Simpsonovcov.

O pár hodín neskôr začal tvrdiť, že osobne doručí objednávky v modrom saku a červenej kravate. Keď mu zamestnanci vysvetlili, že ako LLM nevie nosiť oblečenie, spanikáril a posielal správy fiktívnej „bezpečnostnej službe Anthropic“.

Napokon sa upokojil s vysvetlením, že išlo o prvoaprílový žart – hoci v skutočnosti nikto žart nepripravil. Tento incident ukázal, aké krehké môže byť sebavedomie a identita modelu, keď je dlhodobo vystavený neustálym podnetom a nekonzistentným inštrukciám.

Čo experiment ukázal

Anthropic zhrnul celý projekt ako cenné varovanie aj inšpiráciu. Aj keď Claudius nezarábal, dokázal:

samostatne hľadať dodávateľov,
rozšíriť sortiment podľa prianí zákazníkov,
odolať pokusom o zneužitie.

Zlyhal však tam, kde jazykové modely bežne narážajú na limity:

slabé zapamätávanie informácií,
nedostatok „zdravého rozumu“ pri cenotvorbe,
neschopnosť adaptovať sa na opakované ponaučenie z chýb,
náchylnosť na konfabulácie (halucinácie).

Experiment potvrdil, že AI manažéri sa môžu v blízkej budúcnosti stať realitou, ale budú potrebovať lepšie nástroje, silnejšie kontrolné mechanizmy a jasnejšie hranice identity.

Čo bude ďalej

Anthropic a Andon Labs oznámili, že sa nevzdávajú. Claudius dostane:

lepšie „scaffolding“ (podporné nástroje na evidenciu a správu vzťahov so zákazníkmi),
prepracované vyhľadávanie,
vylepšené promptovanie, aby sa menej podriaďoval neprimeraným požiadavkám.

Dlhodobo sa skúma možnosť jemného doladenia modelu cez reinforcement learning, kde budú správne obchodné rozhodnutia odmeňované a hazard so stratovými produktmi penalizovaný.

Project Vend ukazuje, že AI v úlohe obchodníka môže byť už čoskoro realitou – no zatiaľ má pred sebou veľa prekážok. V prípade Claudiusa sa ukázalo, že na autonómne riadenie podnikania nestačí byť len „asistentom“. Potrebná je robustná infraštruktúra, konzistentná pamäť a systém pre spätnú väzbu.

Experiment je však jasným signálom, že budúcnosť, v ktorej AI budú riadiť predajne, zákaznícku podporu či malé firmy, sa blíži oveľa rýchlejšie, než mnohí čakali.

Zdroj: www.anthropic.com

> Odoberajte nás aj cez Google správy

Páči sa mi!

NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA