3.8 C
Czech
Čtvrtek 9. dubna 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Google chce ovládnout palubní systémy. Představil platformu pro auta budoucnosti

Nový operační systém od Googlu slibuje sjednocení automobilového softwaru i hlubší kontrolu nad funkcemi vozu. Automobilkám má ulehčit vývoj, zároveň ale může setřít jejich jedinečnost.

George Clooney ostře kritizuje Donalda Trumpa kvůli Íránu

Hollywoodská hvězda znovu vstupuje do politiky. George Clooney se pustil do ostré kritiky Donalda Trumpa a jeho výroků o Íránu. Tentokrát ale nejde jen o osobní spor.

Král Karel a Cartier dávají šanci nové generaci hodinářů

Luxusní značka šperků a hodinek a královská nadace spojují síly. Vzniká program, který otevírá dveře do světa precizního řemesla a dává šanci těm, kteří chtějí tvořit skutečné hodinářské umění.

Medveděv se v Monte Carlu zhroutil a utrpěl nejhorší porážku kariéry

Daniil Medveděv zažil v Monte Carlu jeden z nejhorších dnů své kariéry. V utkání proti Matteo Berrettini naprosto odešel. Prohrál 0:6, 0:6 a poprvé v životě inkasoval takzvaný double bagel.

Základny a mimozemšťané. Mýty o odvrácené straně Měsíce

Mise Artemis II se blíží ke svému konci. Posádka kosmické lodi Orion úspěšně obletěla Měsíc a učinila tak významný krok k návratu člověka na naši přirozenou družici –⁠⁠⁠⁠⁠⁠ konkrétně na její odvrácenou stranu. Ta je přitom dlouhodobě předmětem konspiračních teorií. Skrývají se tam mimozemšťané?

Hyundai mění směr. Nové koncepty Venus a Earth naznačily designovou revoluci

Jihokorejská automobilka naznačuje odklon od ikonického „pixelového“ stylu modelů Ioniq. Dvojice tajemných konceptů Venus a Earth ukazuje čistší linie, jednodušší LED světla a možná i novou kapitolu elektrické identity značky.

WhatsApp vylepšil CarPlay pro všechny uživatele iPhonů

WhatsApp rozšiřuje své možnosti v CarPlay a nová verze už je dostupná všem uživatelům iPhonů. Aplikace se tak posouvá od jednoduchého hlasového ovládání k plnohodnotnějšímu prostředí přímo v palubním systému auta.

Blizzard ustoupil kritice. Hrdinka Anran z Overwatch se zásadně proměnila

Komunita hráčů Overwatch si stěžovala na nesoulad mezi filmovou a herní podobou nové hrdinky Anran. Vývojáři z Blizzardu zareagovali a pro druhou sezónu připravili výrazný redesign.

Osm týmů, čtyři příběhy. Liga mistrů vstupuje do čtvrtfinále

Osm týmů zůstává ve hře o trofej. Čtvrtfinále Ligy mistrů nabízí tradiční giganty, ofenzivní přestřelky i nejisté formy. Každý duel má vlastní příběh a žádný favorit nemá nic jisté.

Liga mistrů jde do čtvrtfinále, favorité i otazníky

Osm týmů zůstává ve hře o trofej. Čtvrtfinále Ligy mistrů nabízí tradiční giganty, ofenzivní přestřelky i nejisté formy. Každý duel má vlastní příběh a žádný favorit nemá nic jisté.

Mise Artemis mění pohled lidstva na Měsíc

Návrat člověka k Měsíci znovu otevírá otázku, co pro lidstvo tento vesmírný soused vlastně znamená. Měsíc už dávno není jen světelný bod na noční obloze nebo vzpomínka na program Apollo. S novými misemi Artemis se znovu dostává do středu pozornosti vědy, techniky i širší společenské debaty.

Google Fotky dohánějí rest a přidávají rychlost přehrávání videí

Google do aplikace Fotky na Androidu začal nasazovat funkci, na kterou uživatelé čekali roky. Při přehrávání videí nově půjde měnit rychlost a zpomalit si záběr nebo ho naopak projet rychleji.

Luxus bez kompromisů. Genesis se chystá ochromit trh 22 novými modely

Prémiová značka Genesis vstupuje do druhé dekády s ambiciózním plánem. Hybridy, sportovní modely i individualizace na míru mají změnit její postavení na trhu. Konkurence by měla zbystřit.

Návrat Drakea na obzoru? Výzkum v Karibiku rozjel spekulace o Uncharted 5

Stačila jediná fotografie. Kreativní ředitel studia Naughty Dog Shaun Escayg naznačil „výzkum“ na Trinidadu a fanoušci okamžitě mluví o možném pokračování série Uncharted.

Desmond Doss: Odpůrce vojenské služby, který ve válečném pekle zachránil desítky životů

Válečný film Hacksaw Ridge: Zrození hrdiny z roku 2016 se stal žánrovým hitem. Vypráví příběh mladého odpůrce vojenské služby, který beze zbraně a pod palbou zachránil desítky svých spolubojovníků, čímž si vysloužil status válečného hrdiny. Je až k nevíře, že skutečnost byla ještě působivější než film.
Reklama

DOPORUČUJEME

WhatsApp vylepšil CarPlay pro všechny uživatele iPhonů

WhatsApp rozšiřuje své možnosti v CarPlay a nová verze už je dostupná všem uživatelům iPhonů. Aplikace se tak posouvá od jednoduchého hlasového ovládání k plnohodnotnějšímu prostředí přímo v palubním systému auta.

Google Fotky dohánějí rest a přidávají rychlost přehrávání videí

Google do aplikace Fotky na Androidu začal nasazovat funkci, na kterou uživatelé čekali roky. Při přehrávání videí nově půjde měnit rychlost a zpomalit si záběr nebo ho naopak projet rychleji.

Umělá inteligence proniká do zákulisí Hollywoodu

Umělá inteligence se v Hollywoodu zatím neprosazuje jako revoluce, která by okamžitě měnila pravidla hry. Místo toho nenápadně proniká do každodenního provozu, hlavně na nejnižších pozicích. Právě asistenti, kteří čelí rostoucím nárokům a ubývajícím pracovním místům, ji začínají využívat jako nástroj, bez kterého se už často neobejdou.

Google nasadil Gemma 4 jako novou otevřenou AI

Google představil novou generaci svého otevřeného jazykového modelu Gemma 4, která má být dosud nejpokročilejší v této řadě. Model je navržený tak, aby zvládal složitější úkoly, fungoval i bez internetu a běžel přímo na běžném hardwaru, včetně mobilních zařízení.

Outlook potrápil astronauty na cestě k Měsíci

Mise Artemis II měla být velkým krokem zpět k Měsíci. Jenže sotva loď Orion opustila atmosféru, posádku potkala potíž, kterou dobře znají i lidé z kanceláří. Přestal fungovat Microsoft Outlook.

NEJNOVĚJŠÍ

Google chce ovládnout palubní systémy. Představil platformu pro auta budoucnosti

Nový operační systém od Googlu slibuje sjednocení automobilového softwaru i hlubší kontrolu nad funkcemi vozu. Automobilkám má ulehčit vývoj, zároveň ale může setřít jejich jedinečnost.

George Clooney ostře kritizuje Donalda Trumpa kvůli Íránu

Hollywoodská hvězda znovu vstupuje do politiky. George Clooney se pustil do ostré kritiky Donalda Trumpa a jeho výroků o Íránu. Tentokrát ale nejde jen o osobní spor.

Král Karel a Cartier dávají šanci nové generaci hodinářů

Luxusní značka šperků a hodinek a královská nadace spojují síly. Vzniká program, který otevírá dveře do světa precizního řemesla a dává šanci těm, kteří chtějí tvořit skutečné hodinářské umění.

Medveděv se v Monte Carlu zhroutil a utrpěl nejhorší porážku kariéry

Daniil Medveděv zažil v Monte Carlu jeden z nejhorších dnů své kariéry. V utkání proti Matteo Berrettini naprosto odešel. Prohrál 0:6, 0:6 a poprvé v životě inkasoval takzvaný double bagel.

Základny a mimozemšťané. Mýty o odvrácené straně Měsíce

Mise Artemis II se blíží ke svému konci. Posádka kosmické lodi Orion úspěšně obletěla Měsíc a učinila tak významný krok k návratu člověka na naši přirozenou družici –⁠⁠⁠⁠⁠⁠ konkrétně na její odvrácenou stranu. Ta je přitom dlouhodobě předmětem konspiračních teorií. Skrývají se tam mimozemšťané?
Reklama
Reklama
Reklama