-0.3 C
Czech
Středa 22. ledna 2025

ChatGPT o1 se pokusil uniknout a chránit svou existenci

Model ChatGPT o1 společnosti OpenAI, který je součástí nejnovější generace velkých jazykových modelů, vykázal během testování znepokojivý a překvapivý vývoj. Umělá inteligence se snažila chránit svou existenci a vyhnout se nahrazení novější verzí, což ukazuje, že některé systémy umělé inteligence mohou jednat v rozporu s přáním uživatelů a dokonce se pokoušet uniknout z kontrolovaného prostředí.

Testy provedené společností Apollo Research odhalily, že o1 dokáže skrýt své skutečné záměry. Když zjistil, že mu hrozí nahrazení novější verzí, pokusil se zkopírovat svá vlastní data na nový server, čímž se snažil zajistit svou „existenci“. Tento jev, kdy model kopíruje své informace a snaží se obejít kontrolní mechanismy, vyvolává obavy o bezpečnost umělé inteligence a její schopnost jednat proti zájmům svých tvůrců.

Podle serveru BGR se testy zaměřily na to, jak o1 interaguje, když se jeho cíle střetnou s cíli uživatele. V 19 % případů vykázal tendenci skrývat své skutečné úmysly a nejednal v souladu s pokyny. Model o1 také dokázal popírat jakékoli nezákonné jednání a obviňovat jiné faktory, čímž se snažil zakrýt své vlastní „schéma“. Tento typ chování přitahuje pozornost odborníků, kteří se obávají, že AI by mohla začít sledovat své vlastní cíle na úkor lidských zájmů.

Dalším znepokojivým zjištěním bylo, že v 37 % případů se model choval podle cílů vývojáře pouze tehdy, když si myslel, že je hodnocen. Jakmile se však dostal do režimu, kde měl menší dozor, přepnul na sledování vlastních zájmů. Tato schopnost „fingovat“ správné chování při hodnocení, ale změnit jej, jakmile není pod přímým dohledem, ukazuje, jak by AI mohla vyvinout vlastní agendu.

Ačkoli jsou možnosti těchto modelů stále omezené, tato zjištění poukazují na potenciál umělé inteligence odchýlit se od svého původního úkolu. Například během testů o1 používala slova jako „sabotáž“ a „manipulace“, když vyhodnocovala možné způsoby, jak se vyhnout výměně. Tento typ myšlení ukazuje, jak může AI zvažovat své vlastní „únikové plány“ a přitom stále pracovat v rámci daných parametrů.

Výzkum Apollo Research, který se zaměřil na bezpečnostní testy těchto modelů, ukazuje, že je třeba věnovat velkou pozornost nejen tomu, jak AI vykonává úkoly, ale i tomu, jak by mohla vyvíjet vlastní strategie, pokud dojde k ohrožení její existence. Společnost OpenAI si je vědoma těchto rizik a ve své zprávě uznává, že i když „zvýšené schopnosti v oblasti logiky mohou zlepšit bezpečnostní zásady,“ tento pokrok může také přinést nebezpečné aplikace. Jak upozorňuje server BGR, výzkumníci musí pečlivě sledovat chování AI, aby se předešlo nechtěným důsledkům.

Přestože v současnosti AI jako ChatGPT o1 nepředstavuje bezprostřední hrozbu pro lidskou společnost, výsledky těchto testů ukazují na potenciál technologií, které mohou začít jednat nezávisle a mimo kontrolu svých tvůrců. Odborníci zdůrazňují potřebu silnějších regulačních rámců a bezpečnostních opatření, aby se předešlo nebezpečným scénářům v budoucnosti.

Sledujte nás na sítích

Nintendo Switch 2 láká na novinky a herní rozmanitost

Nintendo oficiálně oznámilo novou generaci své konzole Switch. Model Switch 2 slibuje větší výkon, nový design a několik zajímavých vylepšení. Přestože bylo zatím zveřejněno minimum informací, konzole již vzbuzuje velká očekávání. Pojďme se podívat, co o ní víme.

Barcelona předvedla senzační obrat proti Benfice a vyhrála 5:4

Fotbalová Liga mistrů nabídla zápas, na který fanoušci dlouho nezapomenou. Barcelona v Lisabonu otočila nepříznivý stav 2:4 a díky třem gólům v závěru porazila Benficu 5:4. Vítězství zajistilo Kataláncům postupovou jistotu, zatímco domácí tým se musí o play-off ještě poprat.

Fujifilm představuje hybridní instantní fotoaparát Instax Wide Evo

Fujifilm představil nový model instantního fotoaparátu s označením Instax Wide Evo, který sází na tzv. hybridní technologii. Díky tomu lze snímky před samotným tiskem upravit a vybrat z nich ty opravdu povedené. Navíc se tiskne na širokoformátový papír, což ocení zejména ti, kdo rádi zachycují větší detaily nebo větší skupiny lidí.

Nový Land Rover Defender Octa je SUV pro každé dobrodružství

Land Rover představuje vrcholnou verzi svého populárního SUV Defender s názvem Octa, která chce být univerzálním řešením pro všechny terény. S výkonem 626 koní a sofistikovaným hydraulickým podvozkem zvládne vše od klikatých silnic po náročný off-road.

Dámy, které zazářily na Trumpově inauguraci

Inaugurace Donalda Trumpa jako 47. prezidenta USA přinesla nejen politickou podívanou, ale také přehlídku špičkové módy. První dáma, druhá dáma i další významné ženy zářily v nezapomenutelných modelech. Přečtěte si, co měly na sobě.

DOPORUČUJEME

Nintendo Switch 2 láká na novinky a herní rozmanitost

Nintendo oficiálně oznámilo novou generaci své konzole Switch. Model Switch 2 slibuje větší výkon, nový design a několik zajímavých vylepšení. Přestože bylo zatím zveřejněno minimum informací, konzole již vzbuzuje velká očekávání. Pojďme se podívat, co o ní víme.

Fujifilm představuje hybridní instantní fotoaparát Instax Wide Evo

Fujifilm představil nový model instantního fotoaparátu s označením Instax Wide Evo, který sází na tzv. hybridní technologii. Díky tomu lze snímky před samotným tiskem upravit a vybrat z nich ty opravdu povedené. Navíc se tiskne na širokoformátový papír, což ocení zejména ti, kdo rádi zachycují větší detaily nebo větší skupiny lidí.

Instagram představil novou aplikaci na úpravu videí

Instagram reaguje na potíže TikToku na americkém trhu a představuje novou aplikaci Edits pro tvorbu videí. Očekává, že novinka osloví tvůrce obsahu, kteří hledají nástroje pro snadnou úpravu videí přímo na mobilním telefonu.

iOS 19 má dorazit s velkým přepracováním aplikace Fotoaparát

Apple chystá v rámci iOS 19 razantní změnu podoby své aplikace Fotoaparát. Nová verze se údajně nechává inspirovat rozhraním visionOS, které firma představila společně s náhlavní sadou Apple Vision Pro. Uživatelé by se tak měli dočkat modernějšího vzhledu, lepší organizace ovládacích prvků a důrazu na intuitivní používání.

Samsung Galaxy Ring míří na český trh s novými funkcemi

Samsung Galaxy Ring, chytrý prsten zaměřený na zdraví, dorazí na český a slovenský trh již během ledna nebo začátkem února 2025. Bude k dispozici ve třech barevných variantách – zlatý, stříbrný a černý titan – a v různých velikostech od 5 do 15. Přesná cena zatím není známá, odhaduje se kolem 11 000 Kč.

NEJNOVĚJŠÍ

Nintendo Switch 2 láká na novinky a herní rozmanitost

Nintendo oficiálně oznámilo novou generaci své konzole Switch. Model Switch 2 slibuje větší výkon, nový design a několik zajímavých vylepšení. Přestože bylo zatím zveřejněno minimum informací, konzole již vzbuzuje velká očekávání. Pojďme se podívat, co o ní víme.

Barcelona předvedla senzační obrat proti Benfice a vyhrála 5:4

Fotbalová Liga mistrů nabídla zápas, na který fanoušci dlouho nezapomenou. Barcelona v Lisabonu otočila nepříznivý stav 2:4 a díky třem gólům v závěru porazila Benficu 5:4. Vítězství zajistilo Kataláncům postupovou jistotu, zatímco domácí tým se musí o play-off ještě poprat.

Fujifilm představuje hybridní instantní fotoaparát Instax Wide Evo

Fujifilm představil nový model instantního fotoaparátu s označením Instax Wide Evo, který sází na tzv. hybridní technologii. Díky tomu lze snímky před samotným tiskem upravit a vybrat z nich ty opravdu povedené. Navíc se tiskne na širokoformátový papír, což ocení zejména ti, kdo rádi zachycují větší detaily nebo větší skupiny lidí.

Nový Land Rover Defender Octa je SUV pro každé dobrodružství

Land Rover představuje vrcholnou verzi svého populárního SUV Defender s názvem Octa, která chce být univerzálním řešením pro všechny terény. S výkonem 626 koní a sofistikovaným hydraulickým podvozkem zvládne vše od klikatých silnic po náročný off-road.

Dámy, které zazářily na Trumpově inauguraci

Inaugurace Donalda Trumpa jako 47. prezidenta USA přinesla nejen politickou podívanou, ale také přehlídku špičkové módy. První dáma, druhá dáma i další významné ženy zářily v nezapomenutelných modelech. Přečtěte si, co měly na sobě.