14.5 C
Czech
Pondělí 11. května 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Kočky mohou pomáhat lidem, kteří intenzivněji prožívají emoce

Kočky se v programech na zmírnění stresu objevují mnohem méně často než psi. Nový výzkum ale naznačuje, že právě kontakt s kočkami může přitahovat lidi, kteří intenzivněji prožívají emoce a snadněji reagují na napětí.

Windows 11 dostane zrychlení po vzoru macOS

Microsoft testuje novou funkci pro Windows 11, která má zrychlit spouštění aplikací a zlepšit odezvu systému. Změna se má projevit hlavně u nabídky Start, kontextových menu, vyskakovacích oken a běžných aplikací.

Helldivers 2 pod palbou kritiky. Arrowhead slibuje velké změny a nový obsah

Ještě nedávno byl Helldivers 2 symbolem úspěšné kooperativní akce a jedním z největších multiplayerových hitů posledních let. Teď ale studio Arrowhead čelí rostoucí nespokojenosti hráčů. Komunita hlasitě kritizuje nedostatek nového obsahu i kontroverzní změny v aktualizacích. Vývojáři nyní poprvé reagovali a naznačili, že chystají výraznější evoluci celé hry.

Kia chystá elektrický sporťák pro „gamer generaci“. Nepřímý nástupce Stingeru už je téměř na světě

Automobilka Kia naznačila návrat do světa sportovních sedanů, tentokrát ale bez spalovacího motoru. Korejská značka pracuje na sériové verzi futuristického konceptu Vision Meta Turismo, který má oslovit především mladší řidiče vyrůstající na digitálních technologiích a videohrách. Výsledkem má být elektromobil, jenž naváže na odkaz modelu Stinger, ale zcela novou cestou.

Výzkum ukázal možnou biologickou stopu psychopatických rysů

Mozkové skeny ukázaly rozdíl, který může pomoci vysvětlit impulzivitu a vyhledávání silných zážitků u lidí s psychopatickými rysy. Vědci zjistili, že striatum, tedy oblast spojená s odměnou, motivací a rozhodováním, bylo u těchto lidí v průměru asi o deset procent větší než u kontrolní skupiny.

Slavia po derby trestá fanoušky i hráče

Pražské derby mezi Slavií a Spartou má tvrdou dohru. Klub už rozdal první tresty fanouškům, zavřel Tribunu Sever a zároveň odstavil dva hráče A týmu. Tomáš Chorý a David Douděra podle šéfa klubu Jaroslava Tvrdíka za Slavii už nikdy nenastoupí.

Slavistickou ostudu komentuje i bývalý oblíbenec z Edenu

Ostudný závěr pražského derby mezi Slavií a Spartou má další dozvuky. K řádění části fanoušků v Edenu se vyjádřil i bývalý brazilský fotbalista Adauto, který ve Slavii působil na začátku tisíciletí a mezi fanoušky patřil k oblíbeným tvářím. Jeho vzkaz byl krátký, ostrý a pro sešívané hodně nepříjemný.

Geny regenerace dávají naději na obnovu ztracených končetin

Schopnost regenerovat ztracenou končetinu zůstává pro člověka zatím převážně doménou sci-fi. Nový výzkum axolotlů, zebřiček a myší ale ukazuje, že příroda používá při regeneraci některé společné genetické mechanismy. Právě ty by jednou mohly pomoci při vývoji léčby pro lidi po amputacích.

Z opuštěného mláděte je hvězda japonské zoo

Devítiměsíční makak Punch se stal nečekanou hvězdou malé japonské zoo na předměstí Tokia. Mládě, které po narození opustila matka, si získalo pozornost lidí poté, co začalo hledat útěchu u plyšového orangutana.

V Realu Madrid vypukl konflikt mezi Valverdem a Tchouaménim

Atmosféra v Realu Madrid houstne. Podle informací ze Španělska se během posledních dnů dostali do ostrého konfliktu Federico Valverde a Aurélien Tchouaméni. Napětí mělo vyvrcholit dvěma potyčkami na tréninku, po kterých skončil uruguayský záložník v nemocnici s poraněním hlavy. Klub už zahájil disciplinární řízení a situaci řeší interně.

Tento málo známý královský palác ve Španělsku má více pokojů než Versailles

Jen asi hodinu od Madridu stojí královský palác, který mimo Španělsko zná překvapivě málo lidí. La Granja de San Ildefonso připomíná francouzské Versailles, ale v jednom detailu ho dokonce překonává. Má totiž kolem tří stovek místností.

AirPody s kamerami? Apple je chce využít hlavně pro umělou inteligenci

AirPody s kamerami znějí jako zvláštní nápad, Apple je ale podle zákulisních informací posouvá blíž k výrobě. Nejde o sluchátka na focení ani natáčení. Kamery mají sloužit hlavně umělé inteligenci, aby Siri lépe rozuměla tomu, co má uživatel před sebou.

Siniaková v Římě nevyužila devět mečbolů a končí

Kateřina Siniaková prožila v Římě jeden z nejbolestivějších zápasů sezony. Česká tenistka měla proti Anně Kalinskaya devět mečbolů, ani jeden ale neproměnila a po více než tříhodinové bitvě vypadla ve druhém kole. Naopak Linda Nosková postupuje dál, když bez větších problémů zvládla duel s Anastasií Zakharova.

Shakira představila píseň pro mistrovství světa 2026

Shakira připravila novou píseň pro mistrovství světa ve fotbale 2026. První ukázku představila prostřednictvím krátkého videa, které naznačuje podobu celé skladby. Navazuje tak na své předchozí projekty spojené s fotbalovými šampionáty.

Crimson Desert mění pravidla. Svět už nebude prázdný a hráči znovu dostanou příležitost k boji

Vývojáři z Pearl Abyss vyslyšeli stížnosti komunity a poslali do Crimson Desert jednu z největších aktualizací od vydání hry. Nový patch vrací do světa Pywelu život, přidává návraty bossů, opětovné obsazování pevností a výrazně rozšiřuje endgame obsah.
Reklama

DOPORUČUJEME

Windows 11 dostane zrychlení po vzoru macOS

Microsoft testuje novou funkci pro Windows 11, která má zrychlit spouštění aplikací a zlepšit odezvu systému. Změna se má projevit hlavně u nabídky Start, kontextových menu, vyskakovacích oken a běžných aplikací.

AirPody s kamerami? Apple je chce využít hlavně pro umělou inteligenci

AirPody s kamerami znějí jako zvláštní nápad, Apple je ale podle zákulisních informací posouvá blíž k výrobě. Nejde o sluchátka na focení ani natáčení. Kamery mají sloužit hlavně umělé inteligenci, aby Siri lépe rozuměla tomu, co má uživatel před sebou.

Xbox ustupuje od Copilotu

Microsoft začne odstraňovat Copilot z mobilní aplikace Xbox a zastaví jeho vývoj pro konzole. Umělá inteligence tak u herní značky nedostane tak výraznou roli, jak se ještě nedávno čekalo. Změnu oznámila šéfka Xboxu Asha Sharma.

iPhone a Android dostanou šifrované RCS zprávy

Zprávy mezi iPhony a telefony s Androidem budou bezpečnější. Apple v aktualizaci iOS 26.5 přidá podporu koncového šifrování pro RCS komunikaci mezi aplikací Zprávy na iPhonu a Google Messages na Androidu. Funkce bude zatím označená jako beta.

Notebook nemusíte vypínat každý den

Zavřít víko notebooku je rychlé a pohodlné. Jenže ne vždy to znamená, že si počítač skutečně odpočine. Pro dlouhodobou kondici zařízení je důležité hlavně to, do jakého režimu po zavření víka přejde a zda ho uživatel občas úplně vypne.

NEJNOVĚJŠÍ

Kočky mohou pomáhat lidem, kteří intenzivněji prožívají emoce

Kočky se v programech na zmírnění stresu objevují mnohem méně často než psi. Nový výzkum ale naznačuje, že právě kontakt s kočkami může přitahovat lidi, kteří intenzivněji prožívají emoce a snadněji reagují na napětí.

Windows 11 dostane zrychlení po vzoru macOS

Microsoft testuje novou funkci pro Windows 11, která má zrychlit spouštění aplikací a zlepšit odezvu systému. Změna se má projevit hlavně u nabídky Start, kontextových menu, vyskakovacích oken a běžných aplikací.

Helldivers 2 pod palbou kritiky. Arrowhead slibuje velké změny a nový obsah

Ještě nedávno byl Helldivers 2 symbolem úspěšné kooperativní akce a jedním z největších multiplayerových hitů posledních let. Teď ale studio Arrowhead čelí rostoucí nespokojenosti hráčů. Komunita hlasitě kritizuje nedostatek nového obsahu i kontroverzní změny v aktualizacích. Vývojáři nyní poprvé reagovali a naznačili, že chystají výraznější evoluci celé hry.

Kia chystá elektrický sporťák pro „gamer generaci“. Nepřímý nástupce Stingeru už je téměř na světě

Automobilka Kia naznačila návrat do světa sportovních sedanů, tentokrát ale bez spalovacího motoru. Korejská značka pracuje na sériové verzi futuristického konceptu Vision Meta Turismo, který má oslovit především mladší řidiče vyrůstající na digitálních technologiích a videohrách. Výsledkem má být elektromobil, jenž naváže na odkaz modelu Stinger, ale zcela novou cestou.

Výzkum ukázal možnou biologickou stopu psychopatických rysů

Mozkové skeny ukázaly rozdíl, který může pomoci vysvětlit impulzivitu a vyhledávání silných zážitků u lidí s psychopatickými rysy. Vědci zjistili, že striatum, tedy oblast spojená s odměnou, motivací a rozhodováním, bylo u těchto lidí v průměru asi o deset procent větší než u kontrolní skupiny.
Reklama
Reklama
Reklama