-3.4 C
Czech
Neděle 15. února 2026

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Americká armáda měla při operaci ve Venezuele využít AI Claude

Při operaci americké armády ve Venezuele, jejímž cílem měl být únos prezidenta Nicoláse Madura, se měl objevit i jazykový model Claude od společnosti Anthropic. Jde o další signál, že umělá inteligence už neproniká jen do kanceláří a call center, ale i do vojenských rozhodovacích procesů.

QuitGPT vyzývá k rušení předplatného ChatGPT

Na sociálních sítích se v únoru rozjela kampaň QuitGPT, která nabádá lidi, aby zrušili placené tarify ChatGPT, smazali aplikaci a přešli ke konkurenci. Nejde o protest kvůli výpadkům nebo změnám ve službě, hlavní roli hrají politika, etika a otázka, kdo stojí za nástrojem, který používají miliony lidí.

Hvězda v Andromedě zhasla a zůstala po ní čerstvá černá díra

Jedna z nejjasnějších hvězd v galaxii Andromeda se během pár let vytratila z dohledu. Žádný ohňostroj v podobě supernovy, žádná dramatická exploze, jen pozvolné kosmické zhasnutí. Astronomové teď popisují, že hvězda se tiše zhroutila do černé díry a její okolí dál slabě září v infračerveném světle.

Jílek má olympijské zlato

Rychlobruslař Metoděj Jílek vyhrál na zimních olympijských hrách závod na 10 000 metrů a přidal pro Česko další cenný kov. Po stříbru z pětky tak během jednoho týdne získal druhou olympijskou medaili.

Adamczyková vybojovala na olympiádě stříbro

Česká výprava má na zimních hrách v Itálii třetí medaili. Eva Adamczyková dojela ve finále snowboardcrossu v Livignu druhá, od zlata ji dělily čtyři setiny sekundy. V programu dne zaujalo i další Klaebovo vítězství v běhu na lyžích a solidní umístění českých reprezentantů.

Porsche Macan GTS Electric. SUV, které přidává emoce i výkon

Přestože se tempo růstu elektromobility v poslední době zpomalilo a řada výrobců přehodnocuje své plány, Porsche pokračuje v rozšiřování své elektrické nabídky. Nový Macan GTS Electric pro modelový rok 2026 je už pátou variantou elektrického kompaktního SUV značky a zároveň verzí, která klade největší důraz na sportovní charakter.

Sbírka na podporu rodiny Jamese Van Der Beeka vybrala přes 2 miliony dolarů

Jen pár hodin po oznámení smrti Jamese Van Der Beeka vznikla veřejná sbírka na podporu jeho manželky a šesti dětí. Reakce fanoušků i hollywoodských hvězd byla okamžitá. Částka překonala původní cíl během jediného dne.

Nejstrašlivější smrt v historii? Japonec umíral na následky radiace 83 dní

Tento případ demonstroval, co radiace dokáže s lidským tělem. Hisaši Ouči byl známý jako pohledný sportovec, který miloval ragby. Ve svých pětatřiceti letech pracoval v továrně na zpracování uranu v Tokaimuře. 30. září v roce 1999 byl součástí týmu, který připravoval uran pro jaderné palivo. To ještě nevěděl, že jeho život skončí tím nejhorším možným způsobem.

Tři dny v Rovaniemi stačí na husky, ledopády i polární záři

Finské Rovaniemi v zimě působí jako město ze stolního sněžítka. Všude borovice pod čerstvým sněhem, horké sauny a tma, která nahrává polární záři. Tři dny jsou ideální délka návštěvy, pokud chcete stihnout to hlavní a zároveň si dovolit zpomalit.

Cesta k vakcíně proti HIV možná vede přes skládání DNA

Vědci zkoušejí nový trik, jak přimět imunitní systém zaměřit se na to podstatné v boji s HIV. Místo běžných proteinových „nosičů“ použili takzvané DNA origami: přesně poskládanou trojrozměrnou konstrukci z DNA, na kterou navěsili části viru, aby je imunitní buňky dobře „viděly“.

Přepracovaná Siri má další potíže, Apple mění plán aktualizací

Apple dál posouvá slíbenou proměnu Siri směrem k osobnějšímu a chytřejšímu asistentovi. Funkce, které měly dorazit už s iOS 26.4 v březnu 2026, se mají rozložit do pozdějších verzí systému, část z nich až do iOS 27.

Příběh věrného psa, který žil u hrobu svého pána deset let, inspiroval zákon v Brazílii

Příběh psa, který deset let neopustil hrob svého pána, vedl v brazilském státě São Paulo ke změně zákona. Nová legislativa nyní umožňuje, aby domácí mazlíčci byli pohřbíváni společně se svými majiteli v rodinných hrobkách. Norma, pojmenovaná po psovi Bobovi, vstoupila v platnost tento týden.

Chybějící oči a jazyky. Zánik Ďatlovovy výpravy zůstává záhadou i přes racionální vysvětlení

V zimě roku 1959 se deset mladých lidí vydalo do uralských hor s přesvědčením, že je čeká další náročná, ale zvládnutelná expedice. Byli zkušení, sehraní a zvyklí na mráz i vítr. Do cíle však nikdy nedorazili. Když se pátrací tým o několik týdnů později dostal do horského průsmyku pod vrcholem hory Cholat Sjachyl (Mrtvá hora) čekal tam obraz, z něhož dodnes mrazí. Záhada stále nemá spolehlivé vysvětlení.

Ferrari chystá elektrickou revoluci. V roce 2026 představí pět nových modelů včetně historicky prvního elektromobilu

Italská automobilka Ferrari stojí na prahu zásadní proměny. Podle aktuálních plánů chce během roku 2026 odhalit hned pět nových modelů, přičemž největší pozornost přitahuje vůbec první čistě elektrický vůz značky. Ten ponese jméno Luce a má symbolizovat začátek nové kapitoly v historii slavného výrobce z Maranella, který si dosud zakládal především na spalovacích motorech a emotivním zvuku dvanáctiválců.

Helma padlých sportovců stála Ukrajince závod

Ukrajinský skeletonista Vladyslav Heraskevych přišel na zimních olympijských hrách v Itálii o čtvrteční závod poté, co odmítl nastoupit bez helmy s fotografiemi ukrajinských sportovců, kteří zemřeli během války s Ruskem.
Reklama

DOPORUČUJEME

Americká armáda měla při operaci ve Venezuele využít AI Claude

Při operaci americké armády ve Venezuele, jejímž cílem měl být únos prezidenta Nicoláse Madura, se měl objevit i jazykový model Claude od společnosti Anthropic. Jde o další signál, že umělá inteligence už neproniká jen do kanceláří a call center, ale i do vojenských rozhodovacích procesů.

QuitGPT vyzývá k rušení předplatného ChatGPT

Na sociálních sítích se v únoru rozjela kampaň QuitGPT, která nabádá lidi, aby zrušili placené tarify ChatGPT, smazali aplikaci a přešli ke konkurenci. Nejde o protest kvůli výpadkům nebo změnám ve službě, hlavní roli hrají politika, etika a otázka, kdo stojí za nástrojem, který používají miliony lidí.

Přepracovaná Siri má další potíže, Apple mění plán aktualizací

Apple dál posouvá slíbenou proměnu Siri směrem k osobnějšímu a chytřejšímu asistentovi. Funkce, které měly dorazit už s iOS 26.4 v březnu 2026, se mají rozložit do pozdějších verzí systému, část z nich až do iOS 27.

Samsung ukáže řadu Galaxy S26 už 25. února

Samsung 25. února představí novou řadu smartphonů Galaxy S26. Firma láká hlavně na funkce postavené na umělé inteligenci a na to, že má být součástí běžného používání hned od prvního zapnutí.

YouTube Music začíná dávat texty písní za paywall

Uživatelé bezplatné verze YouTube Music nově narážejí na omezení u textů písní. Po vyčerpání měsíčního limitu aplikace ukáže jen první řádky a zbytek rozmaže, přičemž nabídne přechod na placené předplatné.

NEJNOVĚJŠÍ

Americká armáda měla při operaci ve Venezuele využít AI Claude

Při operaci americké armády ve Venezuele, jejímž cílem měl být únos prezidenta Nicoláse Madura, se měl objevit i jazykový model Claude od společnosti Anthropic. Jde o další signál, že umělá inteligence už neproniká jen do kanceláří a call center, ale i do vojenských rozhodovacích procesů.

QuitGPT vyzývá k rušení předplatného ChatGPT

Na sociálních sítích se v únoru rozjela kampaň QuitGPT, která nabádá lidi, aby zrušili placené tarify ChatGPT, smazali aplikaci a přešli ke konkurenci. Nejde o protest kvůli výpadkům nebo změnám ve službě, hlavní roli hrají politika, etika a otázka, kdo stojí za nástrojem, který používají miliony lidí.

Hvězda v Andromedě zhasla a zůstala po ní čerstvá černá díra

Jedna z nejjasnějších hvězd v galaxii Andromeda se během pár let vytratila z dohledu. Žádný ohňostroj v podobě supernovy, žádná dramatická exploze, jen pozvolné kosmické zhasnutí. Astronomové teď popisují, že hvězda se tiše zhroutila do černé díry a její okolí dál slabě září v infračerveném světle.

Jílek má olympijské zlato

Rychlobruslař Metoděj Jílek vyhrál na zimních olympijských hrách závod na 10 000 metrů a přidal pro Česko další cenný kov. Po stříbru z pětky tak během jednoho týdne získal druhou olympijskou medaili.

Adamczyková vybojovala na olympiádě stříbro

Česká výprava má na zimních hrách v Itálii třetí medaili. Eva Adamczyková dojela ve finále snowboardcrossu v Livignu druhá, od zlata ji dělily čtyři setiny sekundy. V programu dne zaujalo i další Klaebovo vítězství v běhu na lyžích a solidní umístění českých reprezentantů.
Reklama
Reklama
Reklama