3.7 C
Czech
Pátek 27. března 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Přes 20 let žil sám v džungli. Každý ho znal jako „muže z díry“

V brazilské Amazonii žil a zemřel muž, který byl považován za posledního člena svého kmene. Jeho jméno nikdo neznal. Svět ho znal pouze jako „muže z díry“. Přezdívku získal kvůli hlubokým jamám, které po sobě zanechával v džungli. Některé sloužily jako pasti na zvířata, jiné pravděpodobně jako úkryty. Také byl označován za „nejosamělejšího člověka planety“.

Projekt Afeela končí. Sony a Honda odpískaly elektrický sedan i plánované SUV

Ambiciózní spojení technologického giganta Sony a automobilky Honda narazilo na tvrdou realitu trhu. Společný projekt elektrického sedanu Afeela 1 byl definitivně zrušen. Spolu s ním padá i plánované SUV a otázkou zůstává budoucnost celé spolupráce.

Masivní propouštění v Epicu. Fortnite čekají těžké časy

Epic Games propustil tisíc zaměstnanců a zasáhl i klíčové tváře stojící za Fortnite. Zatímco hra zůstává globálním fenoménem, její budoucnost je najednou méně jistá než kdy dřív.

Matyáš Vojta po přestupu do Sparty mluví o splněném snu

Útočník Matyáš Vojta v rozhovoru pro Sport.cz popsal, jak prožívá přestup do Sparty, rekordní očekávání i první větší tlak od fanoušků. Dvaadvacetiletý reprezentant do 21 let bere angažmá na Letné jako splněný sen a chce důvěru splácet hlavně na hřišti.

Auta z Ameriky: na co si dát pozor při výběru a koupi

Auta z Ameriky jsou pro české zákazníky atraktivní volbou. Americký trh nabízí obrovskou rozmanitost...

Val Kilmer se s pomocí AI objeví ve filmu As Deep as the Grave

Val Kilmer se má znovu objevit na filmovém plátně. Tvůrci dramatu As Deep as the Grave dokončují jeho roli pomocí umělé inteligence, aby naplnili původní vizi projektu, na kterém se herec podílel ještě před svou smrtí v roce 2025.

Miley Cyrus znovu jako Hannah Montana, výročí seriálu oslaví speciál

Miley Cyrus si připomíná 20 let od premiéry seriálu Hannah Montana návratem ke své ikonické roli. Výroční speciál i slavnostní premiéra ukazují, že příběh o dvojím životě obyčejné dívky a popové hvězdy má pro fanoušky stále své místo.

Crimson Desert láme rekordy. Tři miliony kopií za pět dní se jen tak nevidí 

Ambiciózní open-world titul Crimson Desert od studia Pearl Abyss slaví obrovský komerční úspěch. Během prvních pěti dnů od vydání se prodaly tři miliony kopií. Nadšení ale částečně brzdí technické potíže a smíšené reakce hráčů.

Mercedes-Maybach S-Class 2027. Ještě víc luxusu, výkonu a okázalosti

Vlajková loď značky Mercedes-Maybach přichází v modernizované podobě. Nová generace luxusního sedanu S-Class přináší výraznější design, ještě opulentnější interiér a posílený osmiválec. Vrcholná limuzína tak znovu posouvá hranice automobilového přepychu.

Resident Evil Requiem drtí konkurenci. Hororový titul ovládl rok 2026

Nový díl legendární série od Capcomu se stal nejprodávanější hrou roku v USA, a to i navzdory relativně klidnému hernímu únoru. Fanoušci jasně ukazují, že o kvalitní survival horor je stále obrovský zájem.

Zprávy mohou být pro Apple hlavní cestou ke konverzační AI

Apple může pro konverzační AI využít platformu, kterou už má dávno v ruce. Vedle chystané nové Siri se jako přirozené místo nabízí aplikace Zprávy, kterou uživatelé používají každý den na iPhonu, iPadu, Macu i Apple Watch.

Při požáru domu zemřela reportérka NHL a její tři děti

Americkou hokejovou scénu zasáhla tragická zpráva. Při požáru domu v Minnesotě zemřela dlouholetá reportérka Jessi Pierce a její tři děti. Bylo jí 37 let.

Japonský Disneyland, který pohltilo ticho

Kdysi sem mířily rodiny za zábavou, dnes by se sem spíš hodil filmový štáb klasického hororu. Nara Dreamland byl park inspirovaný Disneylandem, po zavření se ale proměnil v jedno z nejslavnějších opuštěných míst v Japonsku. Prázdné ulice, rezavé atrakce a kulisy bez lidí z něj udělaly místo, které působí stejně fascinujícím jako znepokojivým dojmem.
Reklama

DOPORUČUJEME

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Zprávy mohou být pro Apple hlavní cestou ke konverzační AI

Apple může pro konverzační AI využít platformu, kterou už má dávno v ruce. Vedle chystané nové Siri se jako přirozené místo nabízí aplikace Zprávy, kterou uživatelé používají každý den na iPhonu, iPadu, Macu i Apple Watch.

Amazon znovu vyvíjí vlastní smartphone

Amazon po více než deseti letech znovu pracuje na vlastním smartphonu. Nový projekt s interním názvem Transformer má stavět na umělé inteligenci, propojení s Alexou a výrazně osobnějším přístupu k mobilním službám.

Tim Cook věří, že iPhone čeká dlouhá budoucnost

Generální ředitel společnosti Apple Tim Cook naznačil, že společnost s iPhonem zdaleka nekončí. V rozhovoru z minulého týdne uvedl, že v oblasti vývoje telefonů Apple je stále spousta prostoru pro další vylepšení a že podle jeho názoru zůstane iPhone klíčovým zařízením v digitálním životě uživatelů.

NEJNOVĚJŠÍ

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Přes 20 let žil sám v džungli. Každý ho znal jako „muže z díry“

V brazilské Amazonii žil a zemřel muž, který byl považován za posledního člena svého kmene. Jeho jméno nikdo neznal. Svět ho znal pouze jako „muže z díry“. Přezdívku získal kvůli hlubokým jamám, které po sobě zanechával v džungli. Některé sloužily jako pasti na zvířata, jiné pravděpodobně jako úkryty. Také byl označován za „nejosamělejšího člověka planety“.

Projekt Afeela končí. Sony a Honda odpískaly elektrický sedan i plánované SUV

Ambiciózní spojení technologického giganta Sony a automobilky Honda narazilo na tvrdou realitu trhu. Společný projekt elektrického sedanu Afeela 1 byl definitivně zrušen. Spolu s ním padá i plánované SUV a otázkou zůstává budoucnost celé spolupráce.

Masivní propouštění v Epicu. Fortnite čekají těžké časy

Epic Games propustil tisíc zaměstnanců a zasáhl i klíčové tváře stojící za Fortnite. Zatímco hra zůstává globálním fenoménem, její budoucnost je najednou méně jistá než kdy dřív.
Reklama
Reklama
Reklama