1.8 C
Czech
Středa 1. dubna 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Král Karel a Camilla zamíří do USA na oslavy 250 let nezávislosti

Král Karel III. a královna Camilla potvrdili návštěvu USA, kde se zúčastní oslav 250 let od vyhlášení americké nezávislosti. Cesta ale nepřichází jen v duchu tradice, odehraje se i v době citlivých politických vztahů.

Uživit se dá i spánkem. Influenceři na něm vydělávají velké peníze

Zatímco většina lidí jde spát, aby se připravila na práci další den, někteří samotný spánek proměnili v byznys. Na platformách YouTube, TikTok nebo Twitch se rozšířil fenomén takzvaných sleepfluencerů, kteří vysílají sami sebe, jak spí. Sledující je pozorují v reálném čase, často celou noc.

Sparta poprvé zvládla sedmý zápas a postupuje do semifinále

Hokejisté Sparty Praha konečně prolomili dlouholeté trápení. V rozhodujícím sedmém utkání play off vyhráli na ledě Plzně 1:0 a poprvé v historii extraligy tak zvládli sedmý duel série. Postup do semifinále zařídil jediný gól Filipa Chlapíka, který se prosadil na začátku druhé třetiny.

Mladý Schwarzenegger vyhrál svou první soutěž v kulturistice

Nejmladší syn Arnolda Schwarzeneggera se vydává po stopách svého otce. Joseph Baena při své první účasti na soutěži NPC Natural Colorado State obsadil první místo hned v několika kategoriích.

Krejčí vede tým do klíčového zápasu

Ladislav Krejčí se vrací na Letnou v jiné roli. Tentokrát jako kapitán reprezentace, která bojuje o mistrovství světa. Před zápasem s Dánskem ale nezaujal jen fotbalem, ale i lidským gestem na tiskové konferenci.

Vietnam vás překvapí na každém kroku. A jídlo je důvod, proč se vracet

Vietnam není země, kterou si odškrtnete během týdenní dovolené. Tady se střídají mlžné hory, rušná města, tiché zátoky i pláže, kde se večer zastaví čas. Během jedné cesty můžete ráno snídat pho na ulici, odpoledne stát nad rýžovými terasami a večer popíjet kávu, která chutná úplně jinak než doma.

Studie spojuje tři malé změny s nižším rizikem infarktu

I malé úpravy denního režimu mohou souviset s nižším rizikem infarktu, mrtvice nebo srdečního selhání. Nová studie ukazuje, že přidat pár minut spánku, trochu pohybu navíc a malou porci zeleniny denně může být pro srdce přínosnější, než se zdá. Nejde přitom o drastickou proměnu životního stylu, ale o drobné změny, které jsou pro většinu lidí reálně dosažitelné.

Apple mění strategii kolem AI

Apple letos přestavuje svou strategii kolem umělé inteligence a Siri. Nový směr se má víc opřít o App Store a o model, který připomíná vyhledávací platformu. Firma se tím zároveň vrací k tomu, na čem dlouhodobě stojí její byznys: prodeji hardwaru a služeb.

Procházka a Ulberg si to rozdají o titul na UFC 327

Jiří Procházka se vrací do boje o titul. Na galavečeru UFC 327 v Miami se 11. dubna utká s Carlosem Ulbergem o pás v polotěžké váze. Ten zůstal volný poté, co Alex Pereira oznámil přesun do těžké divize a titul uvolnil.

Jeff Bezos popsal vizi trilionu lidí ve Sluneční soustavě

Zakladatel Amazonu Jeff Bezos už v roce 2023 mluvil o tom, že by ve Sluneční soustavě jednou mohl žít trilion lidí. Jeho tehdejší výrok teď znovu přitáhl pozornost.

Antonelli slaví další výhru, Bearman havaroval

Velká cena Japonska nabídla dva silné okamžiky. Andrea Kimi Antonelli v Suzuce znovu vyhrál a v 19 letech se posunul do čela šampionátu formule 1, zatímco Oliver Bearman po nejtvrdší havárii dosavadního průběhu sezony odkulhal do lékařského centra.

Astronaut na ISS náhle ztratil řeč, lékaři stále tápou

Astronaut Mike Fincke stále nezná příčinu zdravotního problému, který letos v lednu zasáhl posádku Mezinárodní vesmírné stanice natolik, že NASA poprvé přistoupila k lékařské evakuaci z oběžné dráhy. Zkušený americký astronaut řekl, že se potíže objevily bez varování a lékaři zatím nemají jasnou odpověď.

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Legenda se vrací. Corvette Grand Sport dostane nový atmosférický osmiválec 6,7 litru

Chevrolet vrací do hry slavné jméno Grand Sport a přidává k němu zcela nový motor. Corvette pro modelový rok 2027 nabídne větší, silnější a technicky vyspělejší atmosférický osmiválec, který má posunout ikonický americký sportovní vůz na další úroveň.

Každodenní návyky ve středním věku mohou odhalit tempo stárnutí

To, jak se člověk hýbe a spí ve středním věku, může být výmluvnější, než se zdá. Nový výzkum ukazuje, že právě drobné každodenní návyky mohou už poměrně brzy odhalit, jak rychle organismus stárne.
Reklama

DOPORUČUJEME

Apple mění strategii kolem AI

Apple letos přestavuje svou strategii kolem umělé inteligence a Siri. Nový směr se má víc opřít o App Store a o model, který připomíná vyhledávací platformu. Firma se tím zároveň vrací k tomu, na čem dlouhodobě stojí její byznys: prodeji hardwaru a služeb.

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Zprávy mohou být pro Apple hlavní cestou ke konverzační AI

Apple může pro konverzační AI využít platformu, kterou už má dávno v ruce. Vedle chystané nové Siri se jako přirozené místo nabízí aplikace Zprávy, kterou uživatelé používají každý den na iPhonu, iPadu, Macu i Apple Watch.

NEJNOVĚJŠÍ

Král Karel a Camilla zamíří do USA na oslavy 250 let nezávislosti

Král Karel III. a královna Camilla potvrdili návštěvu USA, kde se zúčastní oslav 250 let od vyhlášení americké nezávislosti. Cesta ale nepřichází jen v duchu tradice, odehraje se i v době citlivých politických vztahů.

Uživit se dá i spánkem. Influenceři na něm vydělávají velké peníze

Zatímco většina lidí jde spát, aby se připravila na práci další den, někteří samotný spánek proměnili v byznys. Na platformách YouTube, TikTok nebo Twitch se rozšířil fenomén takzvaných sleepfluencerů, kteří vysílají sami sebe, jak spí. Sledující je pozorují v reálném čase, často celou noc.

Sparta poprvé zvládla sedmý zápas a postupuje do semifinále

Hokejisté Sparty Praha konečně prolomili dlouholeté trápení. V rozhodujícím sedmém utkání play off vyhráli na ledě Plzně 1:0 a poprvé v historii extraligy tak zvládli sedmý duel série. Postup do semifinále zařídil jediný gól Filipa Chlapíka, který se prosadil na začátku druhé třetiny.

Mladý Schwarzenegger vyhrál svou první soutěž v kulturistice

Nejmladší syn Arnolda Schwarzeneggera se vydává po stopách svého otce. Joseph Baena při své první účasti na soutěži NPC Natural Colorado State obsadil první místo hned v několika kategoriích.

Krejčí vede tým do klíčového zápasu

Ladislav Krejčí se vrací na Letnou v jiné roli. Tentokrát jako kapitán reprezentace, která bojuje o mistrovství světa. Před zápasem s Dánskem ale nezaujal jen fotbalem, ale i lidským gestem na tiskové konferenci.
Reklama
Reklama
Reklama