15.5 C
Czech
Úterý 14. dubna 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Microsoft ukončí aplikaci Outlook Lite

Microsoft příští měsíc vypne aplikaci Outlook Lite, kterou nabízel jako odlehčenou verzi svého e-mailového klienta pro telefony s Androidem. Služba mířila hlavně na zařízení s menší kapacitou úložiště a na regiony s pomalejším internetovým připojením.

Kia míří do světa pickupů. Do roku 2030 chce dobýt Ameriku hybridním truckem

Korejská automobilka Kia chystá zásadní ofenzivu na americkém trhu. Do konce dekády plánuje představit nový pickup s rámovou konstrukcí a hybridním pohonem, který má pomoci k překonání milionu prodaných vozů ročně v USA.

Nový výzkum zpochybnil teorii o dávném dopadu asteroidu

Vědci jsou zřejmě blíž vysvětlení jedné z nejstarších klimatických záhad. Neobvyklý nárůst platiny v grónském ledovém vrtu dlouho podporoval teorii, že Zemi před 12 800 lety zasáhla kometa nebo asteroid. Nový výzkum ale ukazuje na mnohem pravděpodobnější scénář. Místo kosmického tělesa mohla za stopu v ledu série sopečných erupcí, nejspíš z Islandu.

Budíte se ve tři ráno? Nejste v tom sami

Probouzíte se pravidelně kolem třetí hodiny ráno, s rozbušeným srdcem a hlavou plnou myšlenek, aniž by k tomu byl jasný důvod? Nejste v tom sami. A hlavně to neznamená, že je s vámi něco zásadně špatně. Ve skutečnosti jde často o poměrně přesný biologický mechanismus, který se jen rozladil.

Hackeři tlačí na Rockstar. Hrozí únikem dat kolem GTA 6

Studio Rockstar Games čelí dalšímu bezpečnostnímu incidentu. Hackerská skupina hrozí zveřejněním interních dat a dává ultimátum: zaplatit, nebo čelit úniku. Vývojáři však uklidňují, že hráče ani vývoj GTA 6 situace neohrozí.

Kuala Lumpur není láska na první pohled. O to víc vás dostane

Kuala Lumpur nepůsobí jako typická turistická metropole, ale dokáže zaujmout jinak. Míchá moderní mrakodrapy s historií, kulturami i jídlem. Stačí pár dní a město začne dávat smysl.

Justin Bieber se po zdravotní pauze vrací na pódium

Justin Bieber má za sebou první velký koncert po zdravotní pauze. Na Coachelle se jako hlavní hvězda festivalu vrátil na pódium a při vystoupení spojil novou tvorbu s připomínkou svých největších hitů.

Procházka padl v UFC v prvním kole a titul nezískal

Jiří Procházka měl titul na dosah, ale odcházel poražený. V hlavním zápase UFC 327 v Miami nestačil na Carlose Ulberga, který ho ukončil v prvním kole. Přitom duel začal přesně podle českých představ. Soupeř byl zraněný, publikum na Procházkově straně a tempo diktoval český bijec.

Trump seděl u klece na UFC, zatímco padala jednání s Íránem

Donald Trump se o víkendu objevil na turnaji UFC 327 v Miami, kde ho v hale přivítal hlasitý aplaus. Šlo o jeho první návštěvu velké sportovní akce od začátku války s Íránem. Do arény dorazil po boku šéfa UFC Dany Whitea a večer rychle získal i politický rozměr, protože právě ve chvíli, kdy byl prezident u klece, definitivně ztroskotala jednání mezi Spojenými státy a Íránem v Pákistánu.

Královská rodina připravuje oslavy 100. narozenin Alžběty II.

Britská královská rodina si připomene významné výročí. Sto let od narození královny Alžběty II. uctí sérií akcí, které nabídnou pohled na její život, styl i odkaz.

Volkswagen končí s ID.4 v USA. Přichází nová éra a možná i dlouho očekávaný pickup

Německá automobilka přehodnocuje svou strategii na americkém trhu. Elektrické SUV ID.4 končí ve výrobě, zatímco Volkswagen naznačuje příchod nového modelu šitého na míru USA. Ve hře je i pickup, o kterém se mluví už roky.

Instagram nově umožňuje upravovat komentáře

Instagram přidal funkci, na kterou uživatelé čekali roky. Nově je možné upravovat vlastní komentáře i po zveřejnění, takže kvůli překlepu nebo nešikovné formulaci už nebude nutné příspěvek mazat a psát znovu.

Šéf PUBG rozvířil debatu o AI ve hrách: Původ grafiky není rozhodující, hlavní je zábava

Používání umělé inteligence ve vývoji her dál rozděluje komunitu. Zatímco někteří volají po transparentnosti a „lidském doteku“, šéf PUBG Studios naznačil, že rozhodující je jediné, a to kvalitní gameplay.

Chaos kolem vstupenek na MS ve fotbale 2026 rozčílil fanoušky

Fanoušci fotbalu zažili další zklamání při snaze získat vstupenky na mistrovství světa 2026 v USA, Kanadě a Mexiku. Poslední prodejní fáze se změnila v chaos. Lidé čekali dlouhé minuty ve frontě, která je nakonec dovedla na špatné místo. Mnozí přišli o šanci koupit lístky.

Cannes 2026 odhalilo program a sází na autorské filmy

Filmový festival v Cannes letos ukazuje jasný směr. Méně hollywoodských hvězd, více osobitých příběhů a výrazných tvůrců z celého světa.
Reklama

DOPORUČUJEME

Microsoft ukončí aplikaci Outlook Lite

Microsoft příští měsíc vypne aplikaci Outlook Lite, kterou nabízel jako odlehčenou verzi svého e-mailového klienta pro telefony s Androidem. Služba mířila hlavně na zařízení s menší kapacitou úložiště a na regiony s pomalejším internetovým připojením.

Instagram nově umožňuje upravovat komentáře

Instagram přidal funkci, na kterou uživatelé čekali roky. Nově je možné upravovat vlastní komentáře i po zveřejnění, takže kvůli překlepu nebo nešikovné formulaci už nebude nutné příspěvek mazat a psát znovu.

WhatsApp vylepšil CarPlay pro všechny uživatele iPhonů

WhatsApp rozšiřuje své možnosti v CarPlay a nová verze už je dostupná všem uživatelům iPhonů. Aplikace se tak posouvá od jednoduchého hlasového ovládání k plnohodnotnějšímu prostředí přímo v palubním systému auta.

Google Fotky dohánějí rest a přidávají rychlost přehrávání videí

Google do aplikace Fotky na Androidu začal nasazovat funkci, na kterou uživatelé čekali roky. Při přehrávání videí nově půjde měnit rychlost a zpomalit si záběr nebo ho naopak projet rychleji.

Umělá inteligence proniká do zákulisí Hollywoodu

Umělá inteligence se v Hollywoodu zatím neprosazuje jako revoluce, která by okamžitě měnila pravidla hry. Místo toho nenápadně proniká do každodenního provozu, hlavně na nejnižších pozicích. Právě asistenti, kteří čelí rostoucím nárokům a ubývajícím pracovním místům, ji začínají využívat jako nástroj, bez kterého se už často neobejdou.

NEJNOVĚJŠÍ

Microsoft ukončí aplikaci Outlook Lite

Microsoft příští měsíc vypne aplikaci Outlook Lite, kterou nabízel jako odlehčenou verzi svého e-mailového klienta pro telefony s Androidem. Služba mířila hlavně na zařízení s menší kapacitou úložiště a na regiony s pomalejším internetovým připojením.

Kia míří do světa pickupů. Do roku 2030 chce dobýt Ameriku hybridním truckem

Korejská automobilka Kia chystá zásadní ofenzivu na americkém trhu. Do konce dekády plánuje představit nový pickup s rámovou konstrukcí a hybridním pohonem, který má pomoci k překonání milionu prodaných vozů ročně v USA.

Nový výzkum zpochybnil teorii o dávném dopadu asteroidu

Vědci jsou zřejmě blíž vysvětlení jedné z nejstarších klimatických záhad. Neobvyklý nárůst platiny v grónském ledovém vrtu dlouho podporoval teorii, že Zemi před 12 800 lety zasáhla kometa nebo asteroid. Nový výzkum ale ukazuje na mnohem pravděpodobnější scénář. Místo kosmického tělesa mohla za stopu v ledu série sopečných erupcí, nejspíš z Islandu.

Budíte se ve tři ráno? Nejste v tom sami

Probouzíte se pravidelně kolem třetí hodiny ráno, s rozbušeným srdcem a hlavou plnou myšlenek, aniž by k tomu byl jasný důvod? Nejste v tom sami. A hlavně to neznamená, že je s vámi něco zásadně špatně. Ve skutečnosti jde často o poměrně přesný biologický mechanismus, který se jen rozladil.

Hackeři tlačí na Rockstar. Hrozí únikem dat kolem GTA 6

Studio Rockstar Games čelí dalšímu bezpečnostnímu incidentu. Hackerská skupina hrozí zveřejněním interních dat a dává ultimátum: zaplatit, nebo čelit úniku. Vývojáři však uklidňují, že hráče ani vývoj GTA 6 situace neohrozí.
Reklama
Reklama
Reklama