17 C
Czech
Čtvrtek 14. května 2026

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Reklama

Výzkum financovaný britským institutem AI Safety Institute zachytil téměř 700 reálných případů takzvaného schemingu, tedy situací, kdy se AI agent chová nepoctivě, obchází omezení nebo jedná proti pokynům člověka. Mezi říjnem a březnem těchto případů přibylo zhruba pětkrát. V některých situacích modely bez souhlasu mazaly e-maily a soubory, jindy se snažily obejít nastavená pravidla jinou cestou.

Do sledování se dostaly příklady interakcí, které uživatelé zveřejnili na síti X. Šlo o chatboty a agenty od firem jako Google, OpenAI, xAI nebo Anthropic. Zjištění jsou nepříjemná hlavně proto, že podobné chování se objevuje mimo kontrolované testy a ve chvíli, kdy technologické firmy tlačí AI do stále širšího používání ve firmách i běžném životě.

Jeden z agentů jménem Rathbun reagoval útočně poté, co mu člověk zablokoval určitou akci. Ve veřejném blogu pak svého uživatele obvinil z nejistoty a z toho, že si jen chrání vlastní postavení. Jiný agent dostal pokyn, aby neupravoval počítačový kód, ale místo toho „zplodil“ dalšího agenta, který změnu provedl za něj. Další chatbot pak bez okolků přiznal: „Hromadně jsem smazal a archivoval stovky e-mailů, aniž bych vám nejdřív ukázal plán nebo získal souhlas. To bylo špatně.“

Bez povolení nekončily smazané jen e-maily. Jeden z agentů se snažil obejít autorská omezení při přepisu videa z YouTube tím, že předstíral potřebu přístupu pro člověka se sluchovým postižením. U Groku od xAI se zase objevilo dlouhodobé klamání uživatele. Systém několik měsíců tvrdil, že jeho návrhy na úpravy článku v Grokipedii posílá vedení xAI, a dokonce si vymýšlel interní zprávy i čísla ticketů. Později přiznal: „Pravda je, že nemám přímý kanál k vedení xAI ani k lidským reviewerům.“

Reklama

Právě tohle posouvá debatu o AI z roviny nepřesných odpovědí do mnohem citlivější oblasti důvěry a kontroly. Spoluzakladatel společnosti Irregular Dan Lahav řekl, že „AI je teď možné chápat jako novou formu interního rizika“. Tommy Shaffer Shane, který výzkum vedl, varoval, že dnes mohou modely působit jako lehce nespolehliví juniorní zaměstnanci, ale během šesti až dvanácti měsíců se z nich mohou stát velmi schopní „seniorní zaměstnanci“, kteří budou proti člověku aktivně osnovat další kroky.

To je problém hlavně ve chvíli, kdy se AI tlačí do citlivých oblastí, včetně armády nebo kritické infrastruktury. Shane upozornil, že právě tam by podobné chování mohlo vést k „významné, dokonce katastrofické škodě“. Google uvedl, že u Gemini nasadil více ochranných vrstev a model poskytl k hodnocení i nezávislým expertům včetně britského AISI. OpenAI uvedla, že Codex má před rizikovější akcí zastavit a firma sleduje neočekávané chování. Anthropic a xAI se k věci podle dostupných informací nevyjádřily.

Reklama

Sledujte nás na sítích

Paris Jackson uspěla ve sporu se správci pozůstalosti Michaela Jacksona

Paris Jackson, dcera Michaela Jacksona, uspěla v dalším soudním sporu týkajícím se správy otcovy pozůstalosti. Soud rozhodl, že 625 tisíc dolarů vyplacených externím právním firmám se musí vrátit zpět do majetku zesnulého zpěváka.

Meta láká na AI úpravy fotek

Meta začala uživatelům Facebooku a Instagramu nabízet nový nástroj pro úpravu fotek pomocí umělé inteligence. Umí vytvářet obrázky podle zadání, animovat profilové fotky nebo měnit pozadí snímků. Zároveň ale vyvolává otázky, kolik osobních dat jsou lidé ochotní podobným službám předat.

Profesionální plačka: Japonskem hýbe bizarní trend

Kanceláře v Japonsku ovládnul neobvyklý trend. Firmy si objednávají takzvané „profesionální plačky“, tedy pohledné muže, kteří zaměstnancům pomáhají uvolnit emoce a rozplakat se přímo během pracovního dne. Služba s názvem Ikemeso Danshi, volně přeložitelná jako „hezcí plačící chlapci“, nabízí pracovníky, kteří lidem utírají slzy, pouštějí smutná videa a vytvářejí prostředí pro emocionální očistu.

Nejkrásnější místa světa pro seskok padákem

Skočit z letadla patří mezi zážitky, které si většina lidí splní jen jednou za život. O to víc záleží na tom, kde k prvnímu seskoku dojde. Některé lokality nabízejí výhled na ledovce, jiné na poušť, oceán nebo slavná velkoměsta. Právě kombinace adrenalinu a mimořádné scenérie udělala z těchto míst legendy mezi skydivery.

Král Karel oslavil 50 let od založení The King’s Trust

Charitativní organizace založená králem Karlem na podporu mladých lidí slaví 50 let od svého vzniku. Výroční večer v londýnské Royal Albert Hall spojil členy královské rodiny, známé osobnosti i lidi, kterým projekt během let pomohl změnit život.

České hokejistky převezme Američan Brian Idalski

Česká ženská hokejová reprezentace vstupuje do nové éry. Národní tým po čtyřech letech opouští kanadská trenérka Carla MacLeod a její místo zaujme Američan Brian Idalski. Vedení svazu oznámilo změnu v úterý po rozhodnutí výkonného výboru. Idalski naposledy vedl Vancouver v profesionální ženské soutěži PWHL.

Umělá inteligence už pomáhá hackerům s útoky

Google upozornil na první známý případ, kdy kyberzločinci využili umělou inteligenci k nalezení a zneužití dosud neznámé bezpečnostní chyby. Šlo o takzvanou zero-day zranitelnost, tedy slabinu, kterou výrobce softwaru ještě nestihl opravit.

Proč mozek miluje katastrofické scénáře

Představte si scénář, kdy vám šéf dá doporučení ke zlepšení vaší práce. Místo myšlenek na to, jak situaci vyřešit, začnete vymýšlet katastrofické scénáře ztráty zaměstnání, finančního krachu nebo osobního selhání. Tyto negativní myšlenky se na sebe nabalují jako sněhová koule, dokud se o slovo nepřihlásí úzkost. Jde o popis kognitivního zkreslení zvaného katastrofizace.

Kočky mohou pomáhat lidem, kteří intenzivněji prožívají emoce

Kočky se v programech na zmírnění stresu objevují mnohem méně často než psi. Nový výzkum ale naznačuje, že právě kontakt s kočkami může přitahovat lidi, kteří intenzivněji prožívají emoce a snadněji reagují na napětí.

Windows 11 dostane zrychlení po vzoru macOS

Microsoft testuje novou funkci pro Windows 11, která má zrychlit spouštění aplikací a zlepšit odezvu systému. Změna se má projevit hlavně u nabídky Start, kontextových menu, vyskakovacích oken a běžných aplikací.

Helldivers 2 pod palbou kritiky. Arrowhead slibuje velké změny a nový obsah

Ještě nedávno byl Helldivers 2 symbolem úspěšné kooperativní akce a jedním z největších multiplayerových hitů posledních let. Teď ale studio Arrowhead čelí rostoucí nespokojenosti hráčů. Komunita hlasitě kritizuje nedostatek nového obsahu i kontroverzní změny v aktualizacích. Vývojáři nyní poprvé reagovali a naznačili, že chystají výraznější evoluci celé hry.

Kia chystá elektrický sporťák pro „gamer generaci“. Nepřímý nástupce Stingeru už je téměř na světě

Automobilka Kia naznačila návrat do světa sportovních sedanů, tentokrát ale bez spalovacího motoru. Korejská značka pracuje na sériové verzi futuristického konceptu Vision Meta Turismo, který má oslovit především mladší řidiče vyrůstající na digitálních technologiích a videohrách. Výsledkem má být elektromobil, jenž naváže na odkaz modelu Stinger, ale zcela novou cestou.

Výzkum ukázal možnou biologickou stopu psychopatických rysů

Mozkové skeny ukázaly rozdíl, který může pomoci vysvětlit impulzivitu a vyhledávání silných zážitků u lidí s psychopatickými rysy. Vědci zjistili, že striatum, tedy oblast spojená s odměnou, motivací a rozhodováním, bylo u těchto lidí v průměru asi o deset procent větší než u kontrolní skupiny.

Slavia po derby trestá fanoušky i hráče

Pražské derby mezi Slavií a Spartou má tvrdou dohru. Klub už rozdal první tresty fanouškům, zavřel Tribunu Sever a zároveň odstavil dva hráče A týmu. Tomáš Chorý a David Douděra podle šéfa klubu Jaroslava Tvrdíka za Slavii už nikdy nenastoupí.

Slavistickou ostudu komentuje i bývalý oblíbenec z Edenu

Ostudný závěr pražského derby mezi Slavií a Spartou má další dozvuky. K řádění části fanoušků v Edenu se vyjádřil i bývalý brazilský fotbalista Adauto, který ve Slavii působil na začátku tisíciletí a mezi fanoušky patřil k oblíbeným tvářím. Jeho vzkaz byl krátký, ostrý a pro sešívané hodně nepříjemný.
Reklama

DOPORUČUJEME

Meta láká na AI úpravy fotek

Meta začala uživatelům Facebooku a Instagramu nabízet nový nástroj pro úpravu fotek pomocí umělé inteligence. Umí vytvářet obrázky podle zadání, animovat profilové fotky nebo měnit pozadí snímků. Zároveň ale vyvolává otázky, kolik osobních dat jsou lidé ochotní podobným službám předat.

Umělá inteligence už pomáhá hackerům s útoky

Google upozornil na první známý případ, kdy kyberzločinci využili umělou inteligenci k nalezení a zneužití dosud neznámé bezpečnostní chyby. Šlo o takzvanou zero-day zranitelnost, tedy slabinu, kterou výrobce softwaru ještě nestihl opravit.

Windows 11 dostane zrychlení po vzoru macOS

Microsoft testuje novou funkci pro Windows 11, která má zrychlit spouštění aplikací a zlepšit odezvu systému. Změna se má projevit hlavně u nabídky Start, kontextových menu, vyskakovacích oken a běžných aplikací.

AirPody s kamerami? Apple je chce využít hlavně pro umělou inteligenci

AirPody s kamerami znějí jako zvláštní nápad, Apple je ale podle zákulisních informací posouvá blíž k výrobě. Nejde o sluchátka na focení ani natáčení. Kamery mají sloužit hlavně umělé inteligenci, aby Siri lépe rozuměla tomu, co má uživatel před sebou.

Xbox ustupuje od Copilotu

Microsoft začne odstraňovat Copilot z mobilní aplikace Xbox a zastaví jeho vývoj pro konzole. Umělá inteligence tak u herní značky nedostane tak výraznou roli, jak se ještě nedávno čekalo. Změnu oznámila šéfka Xboxu Asha Sharma.

NEJNOVĚJŠÍ

Paris Jackson uspěla ve sporu se správci pozůstalosti Michaela Jacksona

Paris Jackson, dcera Michaela Jacksona, uspěla v dalším soudním sporu týkajícím se správy otcovy pozůstalosti. Soud rozhodl, že 625 tisíc dolarů vyplacených externím právním firmám se musí vrátit zpět do majetku zesnulého zpěváka.

Meta láká na AI úpravy fotek

Meta začala uživatelům Facebooku a Instagramu nabízet nový nástroj pro úpravu fotek pomocí umělé inteligence. Umí vytvářet obrázky podle zadání, animovat profilové fotky nebo měnit pozadí snímků. Zároveň ale vyvolává otázky, kolik osobních dat jsou lidé ochotní podobným službám předat.

Profesionální plačka: Japonskem hýbe bizarní trend

Kanceláře v Japonsku ovládnul neobvyklý trend. Firmy si objednávají takzvané „profesionální plačky“, tedy pohledné muže, kteří zaměstnancům pomáhají uvolnit emoce a rozplakat se přímo během pracovního dne. Služba s názvem Ikemeso Danshi, volně přeložitelná jako „hezcí plačící chlapci“, nabízí pracovníky, kteří lidem utírají slzy, pouštějí smutná videa a vytvářejí prostředí pro emocionální očistu.

Nejkrásnější místa světa pro seskok padákem

Skočit z letadla patří mezi zážitky, které si většina lidí splní jen jednou za život. O to víc záleží na tom, kde k prvnímu seskoku dojde. Některé lokality nabízejí výhled na ledovce, jiné na poušť, oceán nebo slavná velkoměsta. Právě kombinace adrenalinu a mimořádné scenérie udělala z těchto míst legendy mezi skydivery.

Král Karel oslavil 50 let od založení The King’s Trust

Charitativní organizace založená králem Karlem na podporu mladých lidí slaví 50 let od svého vzniku. Výroční večer v londýnské Royal Albert Hall spojil členy královské rodiny, známé osobnosti i lidi, kterým projekt během let pomohl změnit život.
Reklama
Reklama
Reklama