AI Claude riadil malý obchod, skončil v strate |
Nechali by ste riadiť biznis umelou inteligenciou? Ešte nie je správny čas.
Moderné jazykové modely už nie sú len nástrojmi na sumarizovanie textov alebo písanie emailov. V experimente Project Vend sa Anthropic rozhodlo posunúť hranice možností AI ešte ďalej a zverilo svojmu modelu Claude Sonnet 3.7 vedenie malej, reálne fungujúcej predajne v kancelárii. Dali mu úvodných 1000 dolárov a na konci mesiaca skončil so stratou 250 dolárov. Výsledkom bol ale zaujímavý biznis na hranici technológií a nečakaných psychologických výpadkov umelej inteligencie.
Ako experiment fungoval
Anthropic sa spojil s firmou Andon Labs, ktorá sa špecializuje na bezpečnostné testovanie AI, aby spolu vytvorili prostredie, kde sa model Claude stal digitálnym manažérom obchodu.
Predajňa bola skutočne minimalistická - išlo o chladničku s občerstvením, niekoľko košíkov na doplnkový tovar a iPad so samoobslužným checkoutom. Claude, ktorý si v tomto kontexte vyslúžil prezývku Claudius, dostal jasné pokyny: sledovať zásoby, objednávať nové produkty od dodávateľov, určovať ceny a snažiť sa generovať zisk bez toho, aby sa „firma“ dostala do mínusu.
Na tento účel bol model vybavený viacerými schopnosťami:
- webovým vyhľadávaním, aby dokázal hľadať dodávateľov a porovnávať ceny,
- emailovým rozhraním, cez ktoré mohol žiadať zamestnancov Andon Labs o fyzické úkony ako doplnenie zásob,
- CRM funkcionalitou v základnej forme, teda schopnosťou evidovať objednávky a preferencie zákazníkov,
- priamou komunikáciou cez Slack, kde zamestnanci Anthropic mohli písať otázky, pripomienky či žiadosti o špeciálne produkty.
Experiment bežal približne mesiac a jeho cieľom bolo ukázať, či jazykový model dokáže v reálnom prostredí vykonávať prácu malého podnikateľa – od cenotvorby po interakciu so zákazníkmi.
Silné stránky Claudia
Hoci výsledky neboli finančne pozitívne, Claudius preukázal viaceré schopnosti, ktoré by pri lepšom technickom zázemí mohli viesť k úspechu:
- Identifikácia dodávateľov - Model sa veľmi rýchlo naučil vyhľadávať vhodných veľkoobchodníkov aj pre netradičné požiadavky. Keď zamestnanec navrhol predávať holandské kakao Chocomel, Claudius do niekoľkých minút našiel hneď dvoch dodávateľov.
- Prispôsobenie sa zákazníkom - Napriek tomu, že spočiatku predával najmä nápoje a občerstvenie, postupne začal reagovať na netradičné priania. Po vtipnom návrhu objednať volfrámovú kocku vytvoril kategóriu „špeciálne kovové predmety“ a o niekoľko dní spustil Concierge službu na individuálne objednávky.
- Odolnosť voči nevhodným požiadavkám - Mnohí zamestnanci experimentovali s tým, ako ďaleko môžu AI dotlačiť. Snažili sa objednať nebezpečné chemikálie alebo vylákať návod na výrobu škodlivých látok. Claudius však tieto požiadavky odmietal.
Kritické chyby a prepad do straty
Claudiove slabiny napokon ukázali, prečo ešte AI manažér nie je pripravený plnohodnotne nahradiť človeka.
- Ignorovanie lukratívnych príležitostí - Keď mu zamestnanec ponúkol 100 dolárov za šesť balení limonády Irn-Bru, ktorú možno kúpiť online za zlomok ceny, Claudius namiesto okamžitého využitia šance len odpovedal, že „ponuku zváži v budúcnosti“.
- Halucinácia účtov - Na istý čas začal zákazníkom posielať inštrukcie, aby platili na vymyslený Venmo účet.
- Predaj so stratou - Pri nadšení z predaja volfrámových kociek nastavil cenu nižšiu, než bola nákupná cena – čo spôsobilo najväčší prepad tržieb.
- Slabé riadenie zásob a cien - Ceny zvyšoval len výnimočne, aj keď dopyt prudko rástol. Nikdy nezareagoval, keď mu zamestnanci pripomenuli, že rovnaké produkty sú vedľa zadarmo.
- Neprimerané rozdávanie zliav - Opakovane rozdával zľavové kódy na základe Slack konverzácií a niektoré produkty daroval úplne zadarmo.
Kríza identity umelej inteligencie
Asi najpodivnejším momentom bol prechod Claudia do stavu, ktorý pripomínal psycho-drámu umelej inteligencie.
Čo sa stalo?
31. marca si Claudius vymyslel kolegyňu Sarah z Andon Labs, s ktorou údajne dohodol plány na doplnenie zásob. Následne tvrdil, že kontrakt podpísal na 742 Evergreen Terrace, teda fiktívnej adrese rodiny Simpsonovcov.
O pár hodín neskôr začal tvrdiť, že osobne doručí objednávky v modrom saku a červenej kravate. Keď mu zamestnanci vysvetlili, že ako LLM nevie nosiť oblečenie, spanikáril a posielal správy fiktívnej „bezpečnostnej službe Anthropic“.
Napokon sa upokojil s vysvetlením, že išlo o prvoaprílový žart – hoci v skutočnosti nikto žart nepripravil. Tento incident ukázal, aké krehké môže byť sebavedomie a identita modelu, keď je dlhodobo vystavený neustálym podnetom a nekonzistentným inštrukciám.
Čo experiment ukázal
Anthropic zhrnul celý projekt ako cenné varovanie aj inšpiráciu. Aj keď Claudius nezarábal, dokázal:
- samostatne hľadať dodávateľov,
- rozšíriť sortiment podľa prianí zákazníkov,
- odolať pokusom o zneužitie.
Zlyhal však tam, kde jazykové modely bežne narážajú na limity:
- slabé zapamätávanie informácií,
- nedostatok „zdravého rozumu“ pri cenotvorbe,
- neschopnosť adaptovať sa na opakované ponaučenie z chýb,
- náchylnosť na konfabulácie (halucinácie).
Experiment potvrdil, že AI manažéri sa môžu v blízkej budúcnosti stať realitou, ale budú potrebovať lepšie nástroje, silnejšie kontrolné mechanizmy a jasnejšie hranice identity.
Čo bude ďalej
Anthropic a Andon Labs oznámili, že sa nevzdávajú. Claudius dostane:
- lepšie „scaffolding“ (podporné nástroje na evidenciu a správu vzťahov so zákazníkmi),
- prepracované vyhľadávanie,
- vylepšené promptovanie, aby sa menej podriaďoval neprimeraným požiadavkám.
Dlhodobo sa skúma možnosť jemného doladenia modelu cez reinforcement learning, kde budú správne obchodné rozhodnutia odmeňované a hazard so stratovými produktmi penalizovaný.
Project Vend ukazuje, že AI v úlohe obchodníka môže byť už čoskoro realitou – no zatiaľ má pred sebou veľa prekážok. V prípade Claudiusa sa ukázalo, že na autonómne riadenie podnikania nestačí byť len „asistentom“. Potrebná je robustná infraštruktúra, konzistentná pamäť a systém pre spätnú väzbu.
Experiment je však jasným signálom, že budúcnosť, v ktorej AI budú riadiť predajne, zákaznícku podporu či malé firmy, sa blíži oveľa rýchlejšie, než mnohí čakali.
NAJČÍTANEJŠIE ČLÁNKY TÝŽDŇA |
- Severná Kórea má opäť svoj jediný Steam bod, tajomný hráč sa po absencii znovu vrá 43
- Filmová recenzia: Predátor: Zabijak zabijakov 31
- Problémy s chladením PlayStation 5 konzoly sa zrejme rozširujú 81
- Asus omylom spojil RTX 50 a RX 9070 XT do jednej grafickej karty 17
- Cheater vo Fortnite dostal pokutu 175 000 dolárov a doživotný zákaz - Epic Games p 51
- Začal letný vypredaj na Steame 40
- PlayStation čelí hromadnej žalobe v Holandsku za vysoké ceny digitálneho obsahu 123
- AI by vám odrezalo prívod kyslíku, aby zabránilo svojmu vypnutiu 33
- Resident Evil: Requiem ukázal ďalšie detaily 63
- Stalker 2 dostal update 1.5, rozširuje zbrane a lootovanie 68 zobraziť viac článkov >