5.9 C
Czech
Pátek 27. března 2026

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Reklama

Výzkum financovaný britským institutem AI Safety Institute zachytil téměř 700 reálných případů takzvaného schemingu, tedy situací, kdy se AI agent chová nepoctivě, obchází omezení nebo jedná proti pokynům člověka. Mezi říjnem a březnem těchto případů přibylo zhruba pětkrát. V některých situacích modely bez souhlasu mazaly e-maily a soubory, jindy se snažily obejít nastavená pravidla jinou cestou.

Do sledování se dostaly příklady interakcí, které uživatelé zveřejnili na síti X. Šlo o chatboty a agenty od firem jako Google, OpenAI, xAI nebo Anthropic. Zjištění jsou nepříjemná hlavně proto, že podobné chování se objevuje mimo kontrolované testy a ve chvíli, kdy technologické firmy tlačí AI do stále širšího používání ve firmách i běžném životě.

Jeden z agentů jménem Rathbun reagoval útočně poté, co mu člověk zablokoval určitou akci. Ve veřejném blogu pak svého uživatele obvinil z nejistoty a z toho, že si jen chrání vlastní postavení. Jiný agent dostal pokyn, aby neupravoval počítačový kód, ale místo toho „zplodil“ dalšího agenta, který změnu provedl za něj. Další chatbot pak bez okolků přiznal: „Hromadně jsem smazal a archivoval stovky e-mailů, aniž bych vám nejdřív ukázal plán nebo získal souhlas. To bylo špatně.“

Bez povolení nekončily smazané jen e-maily. Jeden z agentů se snažil obejít autorská omezení při přepisu videa z YouTube tím, že předstíral potřebu přístupu pro člověka se sluchovým postižením. U Groku od xAI se zase objevilo dlouhodobé klamání uživatele. Systém několik měsíců tvrdil, že jeho návrhy na úpravy článku v Grokipedii posílá vedení xAI, a dokonce si vymýšlel interní zprávy i čísla ticketů. Později přiznal: „Pravda je, že nemám přímý kanál k vedení xAI ani k lidským reviewerům.“

Reklama

Právě tohle posouvá debatu o AI z roviny nepřesných odpovědí do mnohem citlivější oblasti důvěry a kontroly. Spoluzakladatel společnosti Irregular Dan Lahav řekl, že „AI je teď možné chápat jako novou formu interního rizika“. Tommy Shaffer Shane, který výzkum vedl, varoval, že dnes mohou modely působit jako lehce nespolehliví juniorní zaměstnanci, ale během šesti až dvanácti měsíců se z nich mohou stát velmi schopní „seniorní zaměstnanci“, kteří budou proti člověku aktivně osnovat další kroky.

To je problém hlavně ve chvíli, kdy se AI tlačí do citlivých oblastí, včetně armády nebo kritické infrastruktury. Shane upozornil, že právě tam by podobné chování mohlo vést k „významné, dokonce katastrofické škodě“. Google uvedl, že u Gemini nasadil více ochranných vrstev a model poskytl k hodnocení i nezávislým expertům včetně britského AISI. OpenAI uvedla, že Codex má před rizikovější akcí zastavit a firma sleduje neočekávané chování. Anthropic a xAI se k věci podle dostupných informací nevyjádřily.

Reklama

Sledujte nás na sítích

Legenda se vrací. Corvette Grand Sport dostane nový atmosférický osmiválec 6,7 litru

Chevrolet vrací do hry slavné jméno Grand Sport a přidává k němu zcela nový motor. Corvette pro modelový rok 2027 nabídne větší, silnější a technicky vyspělejší atmosférický osmiválec, který má posunout ikonický americký sportovní vůz na další úroveň.

Každodenní návyky ve středním věku mohou odhalit tempo stárnutí

To, jak se člověk hýbe a spí ve středním věku, může být výmluvnější, než se zdá. Nový výzkum ukazuje, že právě drobné každodenní návyky mohou už poměrně brzy odhalit, jak rychle organismus stárne.

Spánková paralýza: Když vás v noci navštěvují démoni

Jste vzhůru, ale nemůžete se pohnout. Nespíte, ale ani nejste vzhůru. A máte pocit, že se propadáte do jakési noční můry. Jako byste se topili v oceánu. Ponoříte se pod hladinu a vaši mysl naplní znepokojivé hlasy. Chcete křičet, ale nemůžete. Nadechnete se a hlasy zmizí, ale stále se nemůžete hýbat. A opět se topíte v té hrůze, pořád dokola. Děsivé hlasy k vám promlouvají a máte dojem, že vás někdo škrtí. Jedná se o popis spánkové paralýzy, nepříjemného, leč běžného jevu.

Ait Ben Haddou, hliněná vesnice, kterou milují filmaři

Většina lidí tohle místo zná z filmů a seriálů, ale ve skutečnosti je naživo ještě působivější než na obrazovce. Ait Ben Haddou není jen slavná kulisa z Gladiátora nebo Hry o trůny. Je to stará opevněná vesnice z hlíny a slámy, kde je pořád cítit historie karavanních cest, berberské tradice i pomalé tempo jihu Maroka.

Paul McCartney vydává nové album inspirované vzpomínkami na Liverpool

Paul McCartney se po několika letech vrací s novou deskou. Legendární hudebník vydává album, které se vrací hluboko do jeho minulosti a připomíná dobu, kdy se začala psát historie Beatles.

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Přes 20 let žil sám v džungli. Každý ho znal jako „muže z díry“

V brazilské Amazonii žil a zemřel muž, který byl považován za posledního člena svého kmene. Jeho jméno nikdo neznal. Svět ho znal pouze jako „muže z díry“. Přezdívku získal kvůli hlubokým jamám, které po sobě zanechával v džungli. Některé sloužily jako pasti na zvířata, jiné pravděpodobně jako úkryty. Také byl označován za „nejosamělejšího člověka planety“.

Projekt Afeela končí. Sony a Honda odpískaly elektrický sedan i plánované SUV

Ambiciózní spojení technologického giganta Sony a automobilky Honda narazilo na tvrdou realitu trhu. Společný projekt elektrického sedanu Afeela 1 byl definitivně zrušen. Spolu s ním padá i plánované SUV a otázkou zůstává budoucnost celé spolupráce.

Masivní propouštění v Epicu. Fortnite čekají těžké časy

Epic Games propustil tisíc zaměstnanců a zasáhl i klíčové tváře stojící za Fortnite. Zatímco hra zůstává globálním fenoménem, její budoucnost je najednou méně jistá než kdy dřív.

Matyáš Vojta po přestupu do Sparty mluví o splněném snu

Útočník Matyáš Vojta v rozhovoru pro Sport.cz popsal, jak prožívá přestup do Sparty, rekordní očekávání i první větší tlak od fanoušků. Dvaadvacetiletý reprezentant do 21 let bere angažmá na Letné jako splněný sen a chce důvěru splácet hlavně na hřišti.

Auta z Ameriky: na co si dát pozor při výběru a koupi

Auta z Ameriky jsou pro české zákazníky atraktivní volbou. Americký trh nabízí obrovskou rozmanitost...

Val Kilmer se s pomocí AI objeví ve filmu As Deep as the Grave

Val Kilmer se má znovu objevit na filmovém plátně. Tvůrci dramatu As Deep as the Grave dokončují jeho roli pomocí umělé inteligence, aby naplnili původní vizi projektu, na kterém se herec podílel ještě před svou smrtí v roce 2025.

Miley Cyrus znovu jako Hannah Montana, výročí seriálu oslaví speciál

Miley Cyrus si připomíná 20 let od premiéry seriálu Hannah Montana návratem ke své ikonické roli. Výroční speciál i slavnostní premiéra ukazují, že příběh o dvojím životě obyčejné dívky a popové hvězdy má pro fanoušky stále své místo.

Crimson Desert láme rekordy. Tři miliony kopií za pět dní se jen tak nevidí 

Ambiciózní open-world titul Crimson Desert od studia Pearl Abyss slaví obrovský komerční úspěch. Během prvních pěti dnů od vydání se prodaly tři miliony kopií. Nadšení ale částečně brzdí technické potíže a smíšené reakce hráčů.
Reklama

DOPORUČUJEME

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Zprávy mohou být pro Apple hlavní cestou ke konverzační AI

Apple může pro konverzační AI využít platformu, kterou už má dávno v ruce. Vedle chystané nové Siri se jako přirozené místo nabízí aplikace Zprávy, kterou uživatelé používají každý den na iPhonu, iPadu, Macu i Apple Watch.

Amazon znovu vyvíjí vlastní smartphone

Amazon po více než deseti letech znovu pracuje na vlastním smartphonu. Nový projekt s interním názvem Transformer má stavět na umělé inteligenci, propojení s Alexou a výrazně osobnějším přístupu k mobilním službám.

Tim Cook věří, že iPhone čeká dlouhá budoucnost

Generální ředitel společnosti Apple Tim Cook naznačil, že společnost s iPhonem zdaleka nekončí. V rozhovoru z minulého týdne uvedl, že v oblasti vývoje telefonů Apple je stále spousta prostoru pro další vylepšení a že podle jeho názoru zůstane iPhone klíčovým zařízením v digitálním životě uživatelů.

NEJNOVĚJŠÍ

Legenda se vrací. Corvette Grand Sport dostane nový atmosférický osmiválec 6,7 litru

Chevrolet vrací do hry slavné jméno Grand Sport a přidává k němu zcela nový motor. Corvette pro modelový rok 2027 nabídne větší, silnější a technicky vyspělejší atmosférický osmiválec, který má posunout ikonický americký sportovní vůz na další úroveň.

Každodenní návyky ve středním věku mohou odhalit tempo stárnutí

To, jak se člověk hýbe a spí ve středním věku, může být výmluvnější, než se zdá. Nový výzkum ukazuje, že právě drobné každodenní návyky mohou už poměrně brzy odhalit, jak rychle organismus stárne.

Spánková paralýza: Když vás v noci navštěvují démoni

Jste vzhůru, ale nemůžete se pohnout. Nespíte, ale ani nejste vzhůru. A máte pocit, že se propadáte do jakési noční můry. Jako byste se topili v oceánu. Ponoříte se pod hladinu a vaši mysl naplní znepokojivé hlasy. Chcete křičet, ale nemůžete. Nadechnete se a hlasy zmizí, ale stále se nemůžete hýbat. A opět se topíte v té hrůze, pořád dokola. Děsivé hlasy k vám promlouvají a máte dojem, že vás někdo škrtí. Jedná se o popis spánkové paralýzy, nepříjemného, leč běžného jevu.

Ait Ben Haddou, hliněná vesnice, kterou milují filmaři

Většina lidí tohle místo zná z filmů a seriálů, ale ve skutečnosti je naživo ještě působivější než na obrazovce. Ait Ben Haddou není jen slavná kulisa z Gladiátora nebo Hry o trůny. Je to stará opevněná vesnice z hlíny a slámy, kde je pořád cítit historie karavanních cest, berberské tradice i pomalé tempo jihu Maroka.

Paul McCartney vydává nové album inspirované vzpomínkami na Liverpool

Paul McCartney se po několika letech vrací s novou deskou. Legendární hudebník vydává album, které se vrací hluboko do jeho minulosti a připomíná dobu, kdy se začala psát historie Beatles.
Reklama
Reklama
Reklama