-2.2 C
Czech
Neděle 4. ledna 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

AI letos zatížila energetiku a vodní zdroje víc než dřív

Umělá inteligence se během roku 2025 rychle zabydlela v běžných úkolech, od vyhledávání po generování textů a obrázků. S tím ale roste i její méně viditelná cena: energie, voda a emise, které vznikají v pozadí v datacentrech a u výroby hardwaru.

Littler obhájil titul mistra světa v šipkách

Angličan Luke Littler obhájil titul mistra světa v šipkách, když ve finále porazil Nizozemce Giana van Veena 7:1 na sety. Osmnáctiletá světová jednička si kromě trofeje odnesla i rekordní prémii jeden milion liber.

Nové měření kostí posiluje teorii vzpřímené chůze u Sahelanthropa

Sahelanthropus tchadensis je tvor, který žil v Africe před zhruba sedmi miliony let a často se objevuje v debatách o úplně nejstarších „předcích“ člověka. Nová studie teď znovu tvrdí, že se dokázal pohybovat vzpřímeně. Část vědců ale zůstává skeptická a upozorňuje, že důkazů je pořád málo.

Microsoft chce, aby se AI brala jako nástroj pro lidi, ne jako strašák

Satya Nadella, šéf Microsoftu, se snaží posunout debatu o umělé inteligenci do další fáze. Místo strašení ztrátou práce zdůrazňuje, že lidé mají z AI získat pomocníka, který jim ulehčí práci a rozšíří možnosti.

Stranger Things se loučí. Poslední velká bitva přináší maximum emocí

Poslední epizoda Stranger Things nabídla finále, které mělo všechno. Napětí, obří monstrum i dlouhý epilog, který dává prostor rozloučení. Tvůrci nabídli konec bez velkého masakru, zato s pořádnou dávkou emocí.

Littler suverénně prošel čtvrtfinále a je v semifinále mistrovství světa

Luke Littler dál zůstává ve hře o obhajobu titulu mistra světa v šipkách. V londýnské Alexandra Palace zvládl čtvrtfinále bez zaváhání a Poláka Krzysztofa Ratajského přejel 5:0.

Světové osobnosti, které zemřely v roce 2025

V roce 2025 zemřelo několik významných osobností ze světa filmu, hudby, politiky a literatury. Mezi nejznámější patřili Robert Redford, Diane Keaton, Brigitte Bardot, Ozzy Osbourne, papež František a módní návrhář Giorgio Armani.

LG Gallery TV má konkurovat Samsungu The Frame

LG rozšiřuje svou „lifestyle“ řadu televizorů o model, který má v obýváku fungovat i jako obraz. Nová Gallery TV sází na režim s uměním, rámečky a službu Gallery+, zatímco cenu a přesné datum prodeje si výrobce zatím nechává pro sebe.

Cyberpunk 2 nejdříve v roce 2030. Analytici mluví o dlouhém vývoji a obřím rozpočtu

Návratu do futuristického Night City se podle všeho jen tak nedočkáme. Dle nejnovějších odhadů analytiků se pokračování série Cyberpunk od studia CD Projekt Red dostane na trh nejdříve na konci roku 2030, tedy zhruba deset let po vydání původního Cyberpunku 2077.

George Clooney s manželkou Amal získali francouzské občanství

George Clooney a jeho manželka Amal Clooney mají k Francii dlouhodobě blízký vztah a teď ho potvrdili i oficiálně. Francouzské občanství získali nejen oni dva, ale také jejich dvojčata Alexander a Ella. Hlavním důvodem nebyla kariéra, ale soukromí a snaha vychovávat děti mimo tlak Hollywoodu.

Karlos Vémola podstoupil odloženou operaci čelisti

Karlos Vémola měl krátce před Vánoci podstoupit neodkladnou operaci čelisti. Dva dny před Štědrým dnem na sociálních sítích vysvětlil, že ho trápí akutní zánět a zákrok už nelze odkládat.

Subaru láká na návrat legendy. Nový WRX STI se představí už v lednu

Japonská automobilka Subaru naznačila návrat jednoho ze svých nejslavnějších sportovních modelů. Na svých japonských sociálních sítích zveřejnila krátké teaser video, které potvrzuje, že nový Subaru WRX STI bude oficiálně odhalen 9. ledna 2026.

Od Katalánska po Andalusii, objevte nejkrásnější pobřeží Španělska

Španělsko má téměř pět tisíc kilometrů pobřeží a každá část země si moře vykládá po svém. Od divokých útesů na severu přes zátoky na východě až po atlantské pláže s větrem v zádech.

Chevy Chase byl během pandemie osm dní v kómatu

Nový dokument odhaluje, že Chevy Chase v roce 2021 doslova bojoval o přežití a jeho rodina slyšela varování, že se má připravit na nejhorší. Selhání srdce ho poslalo do nemocnice na dlouhé týdny a lékaři ho uvedli do umělého spánku. Chase přiznává, že následky zdravotních problémů pociťuje dodnes.

Co jsme se v roce 2025 dozvěděli o Zemi

Země byla kdysi žhavá koule bez života a vědci pořád zjišťují, jak se z ní stala modrozelená planeta. V roce 2025 přibylo několik překvapivých zjištění od nejstarších hornin až po dění hluboko pod povrchem.
Reklama

DOPORUČUJEME

AI letos zatížila energetiku a vodní zdroje víc než dřív

Umělá inteligence se během roku 2025 rychle zabydlela v běžných úkolech, od vyhledávání po generování textů a obrázků. S tím ale roste i její méně viditelná cena: energie, voda a emise, které vznikají v pozadí v datacentrech a u výroby hardwaru.

Microsoft chce, aby se AI brala jako nástroj pro lidi, ne jako strašák

Satya Nadella, šéf Microsoftu, se snaží posunout debatu o umělé inteligenci do další fáze. Místo strašení ztrátou práce zdůrazňuje, že lidé mají z AI získat pomocníka, který jim ulehčí práci a rozšíří možnosti.

LG Gallery TV má konkurovat Samsungu The Frame

LG rozšiřuje svou „lifestyle“ řadu televizorů o model, který má v obýváku fungovat i jako obraz. Nová Gallery TV sází na režim s uměním, rámečky a službu Gallery+, zatímco cenu a přesné datum prodeje si výrobce zatím nechává pro sebe.

Google zkouší možnost změnit adresu na Gmailu

Mít dodnes v mailu přezdívku ze střední může brzy přestat být problém. Google začal nenápadně zavádět funkci, která dovolí změnit stávající adresu končící na @gmail.com na novou, aniž by uživatel přišel o poštu, fotky nebo navázané služby. Zatím se objevuje jen v omezené podobě a v některých jazykových verzích nápovědy.

ChatGPT spustil roční souhrn Year in Review

ChatGPT přidává roční rekapitulaci, která shrne, jak jste aplikaci během roku používali. Ukáže statistiky, nejčastější témata i osobní „archetyp“. Součástí má být také AI obrázek ve stylu pixel artu a drobná ocenění.

NEJNOVĚJŠÍ

AI letos zatížila energetiku a vodní zdroje víc než dřív

Umělá inteligence se během roku 2025 rychle zabydlela v běžných úkolech, od vyhledávání po generování textů a obrázků. S tím ale roste i její méně viditelná cena: energie, voda a emise, které vznikají v pozadí v datacentrech a u výroby hardwaru.

Littler obhájil titul mistra světa v šipkách

Angličan Luke Littler obhájil titul mistra světa v šipkách, když ve finále porazil Nizozemce Giana van Veena 7:1 na sety. Osmnáctiletá světová jednička si kromě trofeje odnesla i rekordní prémii jeden milion liber.

Nové měření kostí posiluje teorii vzpřímené chůze u Sahelanthropa

Sahelanthropus tchadensis je tvor, který žil v Africe před zhruba sedmi miliony let a často se objevuje v debatách o úplně nejstarších „předcích“ člověka. Nová studie teď znovu tvrdí, že se dokázal pohybovat vzpřímeně. Část vědců ale zůstává skeptická a upozorňuje, že důkazů je pořád málo.

Microsoft chce, aby se AI brala jako nástroj pro lidi, ne jako strašák

Satya Nadella, šéf Microsoftu, se snaží posunout debatu o umělé inteligenci do další fáze. Místo strašení ztrátou práce zdůrazňuje, že lidé mají z AI získat pomocníka, který jim ulehčí práci a rozšíří možnosti.

Stranger Things se loučí. Poslední velká bitva přináší maximum emocí

Poslední epizoda Stranger Things nabídla finále, které mělo všechno. Napětí, obří monstrum i dlouhý epilog, který dává prostor rozloučení. Tvůrci nabídli konec bez velkého masakru, zato s pořádnou dávkou emocí.
Reklama
Reklama
Reklama