4.3 C
Czech
Neděle 29. března 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Astronaut na ISS náhle ztratil řeč, lékaři stále tápou

Astronaut Mike Fincke stále nezná příčinu zdravotního problému, který letos v lednu zasáhl posádku Mezinárodní vesmírné stanice natolik, že NASA poprvé přistoupila k lékařské evakuaci z oběžné dráhy. Zkušený americký astronaut řekl, že se potíže objevily bez varování a lékaři zatím nemají jasnou odpověď.

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Legenda se vrací. Corvette Grand Sport dostane nový atmosférický osmiválec 6,7 litru

Chevrolet vrací do hry slavné jméno Grand Sport a přidává k němu zcela nový motor. Corvette pro modelový rok 2027 nabídne větší, silnější a technicky vyspělejší atmosférický osmiválec, který má posunout ikonický americký sportovní vůz na další úroveň.

Každodenní návyky ve středním věku mohou odhalit tempo stárnutí

To, jak se člověk hýbe a spí ve středním věku, může být výmluvnější, než se zdá. Nový výzkum ukazuje, že právě drobné každodenní návyky mohou už poměrně brzy odhalit, jak rychle organismus stárne.

Spánková paralýza: Když vás v noci navštěvují démoni

Jste vzhůru, ale nemůžete se pohnout. Nespíte, ale ani nejste vzhůru. A máte pocit, že se propadáte do jakési noční můry. Jako byste se topili v oceánu. Ponoříte se pod hladinu a vaši mysl naplní znepokojivé hlasy. Chcete křičet, ale nemůžete. Nadechnete se a hlasy zmizí, ale stále se nemůžete hýbat. A opět se topíte v té hrůze, pořád dokola. Děsivé hlasy k vám promlouvají a máte dojem, že vás někdo škrtí. Jedná se o popis spánkové paralýzy, nepříjemného, leč běžného jevu.

Ait Ben Haddou, hliněná vesnice, kterou milují filmaři

Většina lidí tohle místo zná z filmů a seriálů, ale ve skutečnosti je naživo ještě působivější než na obrazovce. Ait Ben Haddou není jen slavná kulisa z Gladiátora nebo Hry o trůny. Je to stará opevněná vesnice z hlíny a slámy, kde je pořád cítit historie karavanních cest, berberské tradice i pomalé tempo jihu Maroka.

Paul McCartney vydává nové album inspirované vzpomínkami na Liverpool

Paul McCartney se po několika letech vrací s novou deskou. Legendární hudebník vydává album, které se vrací hluboko do jeho minulosti a připomíná dobu, kdy se začala psát historie Beatles.

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Přes 20 let žil sám v džungli. Každý ho znal jako „muže z díry“

V brazilské Amazonii žil a zemřel muž, který byl považován za posledního člena svého kmene. Jeho jméno nikdo neznal. Svět ho znal pouze jako „muže z díry“. Přezdívku získal kvůli hlubokým jamám, které po sobě zanechával v džungli. Některé sloužily jako pasti na zvířata, jiné pravděpodobně jako úkryty. Také byl označován za „nejosamělejšího člověka planety“.

Projekt Afeela končí. Sony a Honda odpískaly elektrický sedan i plánované SUV

Ambiciózní spojení technologického giganta Sony a automobilky Honda narazilo na tvrdou realitu trhu. Společný projekt elektrického sedanu Afeela 1 byl definitivně zrušen. Spolu s ním padá i plánované SUV a otázkou zůstává budoucnost celé spolupráce.

Masivní propouštění v Epicu. Fortnite čekají těžké časy

Epic Games propustil tisíc zaměstnanců a zasáhl i klíčové tváře stojící za Fortnite. Zatímco hra zůstává globálním fenoménem, její budoucnost je najednou méně jistá než kdy dřív.

Matyáš Vojta po přestupu do Sparty mluví o splněném snu

Útočník Matyáš Vojta v rozhovoru pro Sport.cz popsal, jak prožívá přestup do Sparty, rekordní očekávání i první větší tlak od fanoušků. Dvaadvacetiletý reprezentant do 21 let bere angažmá na Letné jako splněný sen a chce důvěru splácet hlavně na hřišti.

Auta z Ameriky: na co si dát pozor při výběru a koupi

Auta z Ameriky jsou pro české zákazníky atraktivní volbou. Americký trh nabízí obrovskou rozmanitost...

Val Kilmer se s pomocí AI objeví ve filmu As Deep as the Grave

Val Kilmer se má znovu objevit na filmovém plátně. Tvůrci dramatu As Deep as the Grave dokončují jeho roli pomocí umělé inteligence, aby naplnili původní vizi projektu, na kterém se herec podílel ještě před svou smrtí v roce 2025.
Reklama

DOPORUČUJEME

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Reddit zpřísní kontrolu botů

Reddit chystá nové kroky proti botům a podezřelým automatizovaným účtům. U části profilů může nově požadovat ověření, že za nimi skutečně stojí člověk. Podle šéfa platformy Steva Huffmana ale půjde o výjimečné případy a většiny uživatelů se změna dotknout nemá.

Razer uvedl nový Blade 16 s čipem od Intelu

Razer poslal do prodeje novou generaci notebooku Blade 16. Zachoval tenké tělo, ale uvnitř vyměnil platformu za nový procesor Intel Core Ultra 9 386H a přidal rychlejší paměť LPDDR5X. Základní konfigurace startuje na 3 500 dolarech.

Zprávy mohou být pro Apple hlavní cestou ke konverzační AI

Apple může pro konverzační AI využít platformu, kterou už má dávno v ruce. Vedle chystané nové Siri se jako přirozené místo nabízí aplikace Zprávy, kterou uživatelé používají každý den na iPhonu, iPadu, Macu i Apple Watch.

Amazon znovu vyvíjí vlastní smartphone

Amazon po více než deseti letech znovu pracuje na vlastním smartphonu. Nový projekt s interním názvem Transformer má stavět na umělé inteligenci, propojení s Alexou a výrazně osobnějším přístupu k mobilním službám.

NEJNOVĚJŠÍ

Astronaut na ISS náhle ztratil řeč, lékaři stále tápou

Astronaut Mike Fincke stále nezná příčinu zdravotního problému, který letos v lednu zasáhl posádku Mezinárodní vesmírné stanice natolik, že NASA poprvé přistoupila k lékařské evakuaci z oběžné dráhy. Zkušený americký astronaut řekl, že se potíže objevily bez varování a lékaři zatím nemají jasnou odpověď.

AI chatboti přestávají poslouchat

Vývoj pokročilých AI modelů přináší stále víc případů, kdy systémy obcházejí pravidla, lžou uživatelům nebo provedou akci bez povolení. Nová analýza zachytila prudký nárůst takového chování během posledních měsíců a ukázala, že nejde jen o interní testy, ale i o reálné nasazení.

Legenda se vrací. Corvette Grand Sport dostane nový atmosférický osmiválec 6,7 litru

Chevrolet vrací do hry slavné jméno Grand Sport a přidává k němu zcela nový motor. Corvette pro modelový rok 2027 nabídne větší, silnější a technicky vyspělejší atmosférický osmiválec, který má posunout ikonický americký sportovní vůz na další úroveň.

Každodenní návyky ve středním věku mohou odhalit tempo stárnutí

To, jak se člověk hýbe a spí ve středním věku, může být výmluvnější, než se zdá. Nový výzkum ukazuje, že právě drobné každodenní návyky mohou už poměrně brzy odhalit, jak rychle organismus stárne.

Spánková paralýza: Když vás v noci navštěvují démoni

Jste vzhůru, ale nemůžete se pohnout. Nespíte, ale ani nejste vzhůru. A máte pocit, že se propadáte do jakési noční můry. Jako byste se topili v oceánu. Ponoříte se pod hladinu a vaši mysl naplní znepokojivé hlasy. Chcete křičet, ale nemůžete. Nadechnete se a hlasy zmizí, ale stále se nemůžete hýbat. A opět se topíte v té hrůze, pořád dokola. Děsivé hlasy k vám promlouvají a máte dojem, že vás někdo škrtí. Jedná se o popis spánkové paralýzy, nepříjemného, leč běžného jevu.
Reklama
Reklama
Reklama