-1.3 C
Czech
Středa 18. února 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Žralok se poprvé objevil na kameře v antarktických hlubinách

V ledových vodách u Antarktidy se poprvé podařilo natočit žraloka, a to v hloubce, kam už neproniká sluneční světlo. Záběry překvapily i odborníky, kteří dosud počítali s tím, že se žraloci v těchto končinách prakticky nevyskytují.

Tanči, dokud nezemřeš. Štrasburská záhada nemá jasné vysvětlení

Začalo to v úzké uličce ve Štrasburku, ve městě Svaté říše římské (území dnešní Francie) roku 1518. Žena jménem Frau Troffea začala nekontrolovaně tančit a nedokázala přestat. Pokračovala celý den až do úplného zhroucení. Manžel jí prosil, aby přestala. Marně. Oteklé a krvavé nohy ji nezastavily a další den tančila znovu. Začala tím jedna z nejpodivnějších nemocí v historii.

Assassin’s Creed Shadows dostává téměř po roce novou funkci

Ubisoft ani rok po vydání nekončí s podporou Assassin’s Creed Shadows. Akční dobrodružství zasazené do feudálního Japonska se nyní dočkalo aktualizace 1.1.8, která přináší několik menších, ale fanoušky dlouho požadovaných změn. Tou nejvýraznější je návrat manuálního skoku, jenž byl známý ze starších dílů série.

Prognóza posouvá Apple AR brýle k roku 2028

Apple sice dál prodává Vision Pro, ale pozornost se zjevně přesouvá k lehčímu formátu. Nová prognóza teď přidává konkrétní okno, kdy by se mohly ukázat dlouho probírané Apple AR brýle.

Curleři na olympiádě v Cortině porazili Německo a dočkali se první výhry

Čeští curleři vybojovali na olympijském turnaji v Cortině d’Ampezzo první vítězství, Německo porazili 9:7. Tým skipa Lukáše Klímy otočil zápas, v němž už prohrával o tři body, a ukončil sérii porážek.

Závodní Ferrari na značkách? Zamaskovaný prototyp naznačuje extrémní 296 Challenge Stradale

Zatímco fanoušci netrpělivě vyhlížejí elektrické Ferrari Luce, v Maranellu se zjevně chystá i něco pro milovníky spalovacích motorů. Na veřejných silnicích se objevil silně maskovaný prototyp, který působí spíš jako závodní speciál než běžné silniční auto. Vše nasvědčuje tomu, že Ferrari testuje extrémní verzi vycházející z modelu 296, pravděpodobně připravovaný 296 Challenge Stradale.

Ve věku 95 let zemřel Robert Duvall, nezapomenutelný Tom Hagen z filmu Kmotr

Hollywood přišel o jednu z nejvýraznějších hereckých osobností druhé poloviny 20. století. Robert Duvall, držitel Oscara a tvář filmů jako Kmotr nebo Apokalypsa, zemřel ve věku 95 let. Za sebou zanechal desítky rolí, které definovaly americkou kinematografii.

Harry Styles bude kurátorem londýnského Meltdown Festivalu

Harry Styles si přidává další roli. Popová hvězda převezme post kurátora prestižního londýnského festivalu Meltdown a zároveň na něm vystoupí. Akce se letos koná při významném výročí Southbank Centre a slibuje kombinaci velkých jmen i nových talentů.

Konec vesmíru může přijít dřív, než se čekalo

Vesmír se už 13,8 miliardy let rozpíná. Nová měření temné energie ale naznačují, že to nemusí pokračovat navždy. Podle výpočtů fyzika z Cornellovy univerzity by se jednou mohl proces otočit a všechno by nakonec spadlo zpátky do jediného bodu.

Keanu Reeves se vrací jako John Wick. Saber Interactive chystá novou akční hru podle slavné filmové série

Během prezentace Sony State of Play došlo k odhalení nového projektu ze světa akční série John Wick. Studio Saber Interactive oficiálně potvrdilo vývoj zatím nepojmenované hry, která nabídne nejen originální příběh zasazený do filmového světa, ale také návrat Keanu Reevese v ikonické roli legendárního zabijáka.

Ticho, které bolí. Tohle místo tichem neléčí, ale svírá

Každý občas potřebuje ticho. Co když se však jinak posvátné ticho stane nesnesitelným hlukem? Co když vás přiměje slyšet vlastní myšlenky, praskání kloubů, bušení srdce a proudění krevního oběhu? Jaké štěstí, že se anechoické komory nepoužívají jako mučící nástroj. Lidé, kteří v nich zkouší vydržet co nejdéle, většinou nevydrží déle než půl hodiny a mají pocit, že se zblázní.

Tři dny ve Fesu. Prozkoumáte největší marockou medinu i místní chutě

Fes je kulturní a duchovní srdce Maroka, které umí návštěvníky okouzlit i zahltit. Během tří dnů ho můžete prozkoumat s následujícím jednoduchým plánem: nejdřív se zorientovat, pak přidat výlet a nakonec zpomalit v hammamu a u jídla.

Americká armáda měla při operaci ve Venezuele využít AI Claude

Při operaci americké armády ve Venezuele, jejímž cílem měl být únos prezidenta Nicoláse Madura, se měl objevit i jazykový model Claude od společnosti Anthropic. Jde o další signál, že umělá inteligence už neproniká jen do kanceláří a call center, ale i do vojenských rozhodovacích procesů.

QuitGPT vyzývá k rušení předplatného ChatGPT

Na sociálních sítích se v únoru rozjela kampaň QuitGPT, která nabádá lidi, aby zrušili placené tarify ChatGPT, smazali aplikaci a přešli ke konkurenci. Nejde o protest kvůli výpadkům nebo změnám ve službě, hlavní roli hrají politika, etika a otázka, kdo stojí za nástrojem, který používají miliony lidí.

Hvězda v Andromedě zhasla a zůstala po ní čerstvá černá díra

Jedna z nejjasnějších hvězd v galaxii Andromeda se během pár let vytratila z dohledu. Žádný ohňostroj v podobě supernovy, žádná dramatická exploze, jen pozvolné kosmické zhasnutí. Astronomové teď popisují, že hvězda se tiše zhroutila do černé díry a její okolí dál slabě září v infračerveném světle.
Reklama

DOPORUČUJEME

Prognóza posouvá Apple AR brýle k roku 2028

Apple sice dál prodává Vision Pro, ale pozornost se zjevně přesouvá k lehčímu formátu. Nová prognóza teď přidává konkrétní okno, kdy by se mohly ukázat dlouho probírané Apple AR brýle.

Americká armáda měla při operaci ve Venezuele využít AI Claude

Při operaci americké armády ve Venezuele, jejímž cílem měl být únos prezidenta Nicoláse Madura, se měl objevit i jazykový model Claude od společnosti Anthropic. Jde o další signál, že umělá inteligence už neproniká jen do kanceláří a call center, ale i do vojenských rozhodovacích procesů.

QuitGPT vyzývá k rušení předplatného ChatGPT

Na sociálních sítích se v únoru rozjela kampaň QuitGPT, která nabádá lidi, aby zrušili placené tarify ChatGPT, smazali aplikaci a přešli ke konkurenci. Nejde o protest kvůli výpadkům nebo změnám ve službě, hlavní roli hrají politika, etika a otázka, kdo stojí za nástrojem, který používají miliony lidí.

Přepracovaná Siri má další potíže, Apple mění plán aktualizací

Apple dál posouvá slíbenou proměnu Siri směrem k osobnějšímu a chytřejšímu asistentovi. Funkce, které měly dorazit už s iOS 26.4 v březnu 2026, se mají rozložit do pozdějších verzí systému, část z nich až do iOS 27.

Samsung ukáže řadu Galaxy S26 už 25. února

Samsung 25. února představí novou řadu smartphonů Galaxy S26. Firma láká hlavně na funkce postavené na umělé inteligenci a na to, že má být součástí běžného používání hned od prvního zapnutí.

NEJNOVĚJŠÍ

Žralok se poprvé objevil na kameře v antarktických hlubinách

V ledových vodách u Antarktidy se poprvé podařilo natočit žraloka, a to v hloubce, kam už neproniká sluneční světlo. Záběry překvapily i odborníky, kteří dosud počítali s tím, že se žraloci v těchto končinách prakticky nevyskytují.

Tanči, dokud nezemřeš. Štrasburská záhada nemá jasné vysvětlení

Začalo to v úzké uličce ve Štrasburku, ve městě Svaté říše římské (území dnešní Francie) roku 1518. Žena jménem Frau Troffea začala nekontrolovaně tančit a nedokázala přestat. Pokračovala celý den až do úplného zhroucení. Manžel jí prosil, aby přestala. Marně. Oteklé a krvavé nohy ji nezastavily a další den tančila znovu. Začala tím jedna z nejpodivnějších nemocí v historii.

Assassin’s Creed Shadows dostává téměř po roce novou funkci

Ubisoft ani rok po vydání nekončí s podporou Assassin’s Creed Shadows. Akční dobrodružství zasazené do feudálního Japonska se nyní dočkalo aktualizace 1.1.8, která přináší několik menších, ale fanoušky dlouho požadovaných změn. Tou nejvýraznější je návrat manuálního skoku, jenž byl známý ze starších dílů série.

Prognóza posouvá Apple AR brýle k roku 2028

Apple sice dál prodává Vision Pro, ale pozornost se zjevně přesouvá k lehčímu formátu. Nová prognóza teď přidává konkrétní okno, kdy by se mohly ukázat dlouho probírané Apple AR brýle.

Curleři na olympiádě v Cortině porazili Německo a dočkali se první výhry

Čeští curleři vybojovali na olympijském turnaji v Cortině d’Ampezzo první vítězství, Německo porazili 9:7. Tým skipa Lukáše Klímy otočil zápas, v němž už prohrával o tři body, a ukončil sérii porážek.
Reklama
Reklama
Reklama