13.1 C
Czech
Sobota 12. července 2025

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Reklama

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Reklama

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Reklama

Sledujte nás na sítích

Justin Bieber vydal nečekané album Swag

Justin Bieber překvapil fanoušky novým albem Swag, které vypustil do světa bez předchozího oznámení. Jde o jeho první studiovou desku od roku 2021. Obsahuje 21 skladeb a řadu hostů, včetně Gunny, Sexyy Red, Lil B, 2 Chainze a Druskiho.

Chytré hodinky s umělou inteligencí pomáhají s koncentrací i novými návyky

Chytré hodinky nejsou jen módní doplněk nebo sportovní pomůcka. S příchodem AI funkcí, jako je Gemini na systému Wear OS, se z nich stává osobní kouč. Pomáhají držet režim, omezit závislost na telefonu a zvládat pracovní tempo bez zbytečných výpadků.

Star Wars Battlefront 2 opět na vrcholu. Osm let stará hra se vrací mezi bestsellery

Pro někoho nepochopitelným způsobem se Battlefront 2 vrátil! Osm let po svém vydání je střílečka od EA opět jednou z nejprodávanějších her – v květnu se vyšplhala až na 12. místo mezi nejvýdělečnějšími tituly v USA.

Chevrolet Silverado EV LT 2025 dokáže překvapit 

Chevrolet přichází s dostupnější verzí svého elektrického pick-upu. Nový Silverado EV LT sice stojí méně než prémiová verze RST, ale zůstává tím, čím byl od začátku – obrovským, těžkým a nepřehlédnutelným kolosem.

PSG rozdrtil Real a jde do finále mistrovství světa klubů

Paris Saint-Germain smetl Real Madrid 4:0 a postoupil do finále klubového šampionátu, kde se v neděli utká s Chelsea. Na stadionu MetLife v New Jersey rozhodla už první půlhodina, kdy Pařížané třikrát skórovali. Čtvrtý zásah přidal Ramos krátce před koncem.

Přehrady na Zemi posunuly póly o více než metr

Lidé za posledních 200 let postavili tisíce přehrad. Tyhle masivní zásahy do krajiny ale neovlivnily jen řeky a zásoby vody. Nový výzkum ukazuje, že hromadění vody v přehradách posunulo zemské póly o víc než metr.

Svaneti, kulturní trezor Gruzie. Zde vás čeká návrat v čase o celá staletí

Vysoko v horách na severozápadě Gruzie leží kraj, který jako by odolával času. Svaneti, oblast obklopená štíty Kavkazu, působí jako středověká pevnost. Se svou divokou přírodou, kamennými věžemi a kulturou se během staletí změnila jen minimálně.

Joao Pedro zařídil Chelsea postup do finále MS klubů

První start v základní sestavě Chelsea, dva góly a postup do finále. Útočník Joao Pedro prožil večer snů. V semifinále mistrovství světa klubů skolil dvěma trefami Fluminense, svůj bývalý klub, a výrazně si řekl o pevné místo v týmu.

Je tu nový Rivian R1T a R1S pro rok 2026

Americká značka Rivian opět posouvá hranice výkonu elektromobilů. Modely R1T (pickup) a R1S (SUV) prošly výrazným faceliftem a ve verzi se čtyřmi elektromotory nabízejí dechberoucí výkon jak na silnici, tak v terénu.

Overwatch 2 se vrací ke kořenům. Hráči dostanou oblíbené hlasovací karty

Jedna z nejoblíbenějších funkcí původního Overwatche se chystá na návrat do druhého dílu. Vývojáři potvrdili, že pracují na přidání hlasovacích karet po skončení zápasu.

Apple Maps přidává přirozené vyhledávání a ochranu proti přehřátí

Apple pokračuje v tichém vylepšování svých map a s betou iOS 26 se objevují dvě nové funkce, které mohou změnit způsob, jakým aplikaci používáme. Obě zatím Apple oficiálně nepředstavil, ale vývojáři je našli přímo v kódu systému. A vypadá to, že tentokrát nejde jen o drobné ladění.

Řecko kvůli vysokým teplotám uzavřelo Akropoli

V Řecku udeřila další vlna veder a úřady opět sáhly k omezením. Turisticky vyhledávaná Akropolis v Athénách zůstala v úterý na čtyři hodiny uzavřená. Důvodem jsou teploty atakující 40 stupňů Celsia a varování nejvyššího stupně před požáry. Ministerstvo kultury uzavření Akropole vysvětlilo snahou zajistit bezpečí jak pro turisty, tak pro zaměstnance.

Cardi B se v Paříži blýskla účesem i živou vránou

Cardi B na pařížském týdnu módy opět ukázala, že ví, jak upoutat pozornost. Na přehlídku Schiaparelli zvolila nejen dramatický model s perličkami a výraznými rameny, ale i nejžhavější účes roku – rovný, lesklý blunt bob s hlubokou pěšinkou a sčesanou ofinou. A právě ten jí přidal na sebevědomí i eleganci.

Thiago Silva táhne Fluminense. Chelsea čeká známý protivník

Fluminense se nenápadně protlačilo až do semifinále mistrovství světa klubů a v cestě do finále jim teď stojí Chelsea. Klub z Ria těží z překvapivě pevné obrany, týmového ducha a také z jednoho jména, které zná každý fanoušek Premier League – Thiago Silva.

BMW CE 04 pro rok 2025. Městský elektroskútr budoucnosti přichází ve třech verzích

BMW vylepšuje svůj futuristický elektrický skútr CE 04 a pro modelový rok 2025 jej nabídne ve třech výbavových stupních. Tento výrazný, moderní dopravní prostředek, původně představený v roce 2021, získal ocenění MCN Award za nejlepší městský elektroskútr – a nyní dostává další technologické i praktické upgrady.
Reklama

DOPORUČUJEME

Chytré hodinky s umělou inteligencí pomáhají s koncentrací i novými návyky

Chytré hodinky nejsou jen módní doplněk nebo sportovní pomůcka. S příchodem AI funkcí, jako je Gemini na systému Wear OS, se z nich stává osobní kouč. Pomáhají držet režim, omezit závislost na telefonu a zvládat pracovní tempo bez zbytečných výpadků.

Apple Maps přidává přirozené vyhledávání a ochranu proti přehřátí

Apple pokračuje v tichém vylepšování svých map a s betou iOS 26 se objevují dvě nové funkce, které mohou změnit způsob, jakým aplikaci používáme. Obě zatím Apple oficiálně nepředstavil, ale vývojáři je našli přímo v kódu systému. A vypadá to, že tentokrát nejde jen o drobné ladění.

iPhone 17 Pro Max dostane větší baterii než kdy dřív

Apple chystá na září premiéru iPhonů 17 a už teď je jasné, že rozdíl mezi modely Pro a Pro Max bude letos výraznější než obvykle. Největší změna se týká baterie. Pro Max má dostat dosud nejvyšší kapacitu v historii iPhonů.

TikTok zaplavily rasistická videa vytvořená pomocí umělé inteligence

Na TikToku kolují krátká videa plná rasistických stereotypů. Podle organizace Media Matters, která se zaměřuje na kontrolu médií, mnohá z nich vznikla pomocí nástroje Google Veo 3. Přestože mají platformy přísná pravidla, některé klipy nasbíraly miliony zhlédnutí.

Apple Music slaví 10 let a představuje novou playlistovou retrospektivu

Apple Music slaví deset let od svého spuštění a naděluje předplatitelům výjimečný dárek. Uživatelé si nově mohou přehrát personalizovaný playlist „Replay All Time“, který mapuje jejich nejoblíbenější skladby za celé období používání služby.

NEJNOVĚJŠÍ

Justin Bieber vydal nečekané album Swag

Justin Bieber překvapil fanoušky novým albem Swag, které vypustil do světa bez předchozího oznámení. Jde o jeho první studiovou desku od roku 2021. Obsahuje 21 skladeb a řadu hostů, včetně Gunny, Sexyy Red, Lil B, 2 Chainze a Druskiho.

Chytré hodinky s umělou inteligencí pomáhají s koncentrací i novými návyky

Chytré hodinky nejsou jen módní doplněk nebo sportovní pomůcka. S příchodem AI funkcí, jako je Gemini na systému Wear OS, se z nich stává osobní kouč. Pomáhají držet režim, omezit závislost na telefonu a zvládat pracovní tempo bez zbytečných výpadků.

Star Wars Battlefront 2 opět na vrcholu. Osm let stará hra se vrací mezi bestsellery

Pro někoho nepochopitelným způsobem se Battlefront 2 vrátil! Osm let po svém vydání je střílečka od EA opět jednou z nejprodávanějších her – v květnu se vyšplhala až na 12. místo mezi nejvýdělečnějšími tituly v USA.

Chevrolet Silverado EV LT 2025 dokáže překvapit 

Chevrolet přichází s dostupnější verzí svého elektrického pick-upu. Nový Silverado EV LT sice stojí méně než prémiová verze RST, ale zůstává tím, čím byl od začátku – obrovským, těžkým a nepřehlédnutelným kolosem.

PSG rozdrtil Real a jde do finále mistrovství světa klubů

Paris Saint-Germain smetl Real Madrid 4:0 a postoupil do finále klubového šampionátu, kde se v neděli utká s Chelsea. Na stadionu MetLife v New Jersey rozhodla už první půlhodina, kdy Pařížané třikrát skórovali. Čtvrtý zásah přidal Ramos krátce před koncem.
Reklama
Reklama
Reklama