13.9 C
Czech
Pondělí 27. dubna 2026

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Reklama

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Reklama

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Sledujte nás na sítích

Nissan oživil legendu. Terrano se vrací jako drsný plug-in hybrid připravený do terénu

Japonská automobilka představila dvojici nových konceptů, mezi nimiž výrazně vyčnívá návrat jména Terrano. Robustní SUV s plug-in hybridním pohonem má ambice zamířit do sériové výroby už během příštího roku.

Některým lidem stačí 4 hodiny spánku. V čem spočívá jejich tajemství?

Představa, že někomu stačí jen pár hodin spánku, zní jako sen. Pro malou skupinu lidí je to ale realita. Takzvaní „krátcí spáči“ fungují plnohodnotně i se čtyřmi až šesti hodinami spánku denně, aniž by pociťovali únavu nebo zdravotní potíže.

Ulánbátar: Kde končí město a začíná Mongolsko

Na Mongolsko by bylo ideální mít týdny. Ale i krátká zastávka v Ulánbátaru dokáže ukázat kus země, kde se město rychle mění v otevřenou krajinu, beton v hory a ruch metropole v ticho u buddhistického chrámu.

Černobyl se čtyřicet let po havárii mění ve vojenské pásmo

Černobylská zóna zůstává jedním z nejznámějších symbolů jaderné katastrofy. Čtyřicet let po výbuchu reaktoru ale nese další vrstvu dějin. Místo opuštěných měst, zarůstajících domů a radioaktivní půdy se kvůli válce stalo také bezpečnostním pásmem, které má Ukrajina pod vojenskou kontrolou.

Diamantová liga výrazně zvyšuje prémie pro atlety

Atletická Diamantová liga vstupuje do nové éry. Organizátoři oznámili výrazné navýšení finančních odměn. Od roku 2025 se mezi sportovce rozdělí celkem 9,24 milionu dolarů. Jde o nejvyšší částku od vzniku seriálu v roce 2010.

Bořil dostal stop na sedm zápasů sezona pro něj skončila

Kapitán Slavie Jan Bořil dohrál sezonu předčasně. Disciplinární komise mu po víkendovém zápase v Hradci Králové udělila trest na sedm soutěžních utkání. Obránce tak přijde o závěr ligy i nadstavbu a zasáhne až do dalšího ročníku.

Návrat pirátské legendy. Assassin’s Creed: Black Flag Resynced mění pravidla hry

Ubisoft po letech spekulací konečně odhalil detaily remaku Assassin’s Creed IV: Black Flag. Nová verze s podtitulem Resynced přinese přepracovaný soubojový systém, nové příběhy i postavy, ale zároveň překvapivě odstraňuje multiplayer a část původního obsahu.

Gibraltarské opice si po nezdravém jídle pomáhají hlínou

Makakové na Gibraltaru si zřejmě našli nečekaný způsob, jak si poradit s následky lidské štědrosti. Vědci si všimli, že opice s největším kontaktem s turisty jedí více hlíny, pravděpodobně proto, aby zklidnily trávení po sladkých a slaných pochutinách.

Malajský ostrov Tioman, tropický ráj bez masového turismu

Ostrov Tioman láká na tropické pláže, džungli i pestrý podmořský svět. Panuje tu uvolněná atmosféra. Návštěvníci mají šanci ideálně nakombinovat dobrodružství s odpočinkem, přesně podle každého gusta.

Třinec vyrovnal finále na 2:2 a zlomil Pardubice doma

Finále extraligy nabralo dramatický směr. Třinec zvládl i druhý domácí zápas a po výhře 4:2 dorovnal sérii s Pardubicemi na 2:2. Oceláři tak rychle odpověděli na úvodní porážky z venku a znovu ukázali, že se s nimi musí počítat.

Princ Harry nečekaně dorazil do Kyjeva a promluvil o válce

Princ Harry překvapil nečekanou návštěvou Ukrajiny. V Kyjevě se setkal s vojáky i zástupci organizací a zdůraznil dopady války i potřebu další podpory. Jeho vyjádření byla otevřenější než u většiny členů královské rodiny.

Manželka obviněného vraha přežívá v troskách rodinného sídla

Asa Ellerup stále obývá dům v Massapequa Park, který se stal středobodem vyšetřování brutálních vražd na Gilgo Beach. Přestože policie nemovitost během razií doslova obrátila naruby, žena obviněného sériového vraha se rozhodla zůstat. Každou noc uléhá v ložnici, o které se vyšetřovatelé domnívají, že v ní Rex Heuermann mohl trýznit své oběti v době, kdy byla jeho manželka s dětmi mimo domov.

Závislost na notifikacích: Proč působí jako drogy

Chytré telefony jsou běžnou součástí našeho života. Manipulace s nimi je přitom extrémně návyková. Vědci dokonce přirovnávají závislost na internetu k závislosti na kokainu. Také vám doslova poskočí srdce, když váš mobil rozvibruje notifikace? Pak možná patříte mezi nevědomě závislé.

Američtí lékaři promluvili o absurditách tamního zdravotnictví

V Česku si občas stěžujeme na čekací doby u specialistů nebo na kvalitu nemocniční stravy. Pohled za oceán ale naznačuje, že v porovnání s USA žijeme v „pacientském ráji“. Zatímco v Americe se vedou vášnivé debaty o miliardových výdajích na válku v Íránu nebo o stavbě obřích vítězných oblouků ve Washingtonu, obyčejní Američané i jejich lékaři bijí na poplach: „My chceme prostě jen dostupnou péči.“

Špatné návyky ničí nabíjecí kabely častěji než jejich smotávání

Nabíjecí kabely jsou pravděpodobně nejvíce přehlíženou součástí naší technologické výbavy – tedy až do chvíle, kdy se zlomí a telefon zůstane bez energie. Většina lidí se domnívá, že za krátkou životnost může špatné smotávání, vědci však nyní potvrzují, že skutečný viník je jinde. Podle Michaela Pechta z Marylandské univerzity, jehož laboratoř zkoumá defekty elektroniky pod rentgenem, je způsob balení kabelu do kruhů či osmiček v podstatě irelevantní. Skutečným zabijákem jsou naše každodenní návyky při samotném používání.
Reklama

DOPORUČUJEME

Špatné návyky ničí nabíjecí kabely častěji než jejich smotávání

Nabíjecí kabely jsou pravděpodobně nejvíce přehlíženou součástí naší technologické výbavy – tedy až do chvíle, kdy se zlomí a telefon zůstane bez energie. Většina lidí se domnívá, že za krátkou životnost může špatné smotávání, vědci však nyní potvrzují, že skutečný viník je jinde. Podle Michaela Pechta z Marylandské univerzity, jehož laboratoř zkoumá defekty elektroniky pod rentgenem, je způsob balení kabelu do kruhů či osmiček v podstatě irelevantní. Skutečným zabijákem jsou naše každodenní návyky při samotném používání.

WhatsApp spustí placené předplatné s novými funkcemi

Nejoblíbenější komunikační aplikace na světě chystá zásadní změnu ve svém fungování. Společnost Meta plánuje brzy spustit placenou verzi s názvem WhatsApp Plus, která uživatelům za měsíční poplatek zpřístupní exkluzivní funkce a širší možnosti přizpůsobení vzhledu. Novinka se už objevila v testovací verzi pro systém Android a brzy se očekává její rozšíření na telefony iPhone i počítače Mac.

Samsung přidá nové AI nástroje i do starších Galaxy telefonů

Samsung chystá další rozšíření funkcí z řady Galaxy S26 i na starší telefony. Přes betaverzi One UI 8.5 se mají k milionům uživatelů dostat nové nástroje Galaxy AI včetně vylepšeného Bixbyho, práce se zvukem, úprav fotek i asistenta pro hovory.

iPhone 18 Pro má dostat čtyři nové barvy

Chystaný iPhone 18 Pro by mohl dorazit ve čtyřech barevných variantách. Největší pozornost budí odstín označovaný jako Dark Cherry, tedy tmavě třešňová barva, která má být hlavní novinkou letošní řady Pro.

Microsoft ukončí aplikaci Outlook Lite

Microsoft příští měsíc vypne aplikaci Outlook Lite, kterou nabízel jako odlehčenou verzi svého e-mailového klienta pro telefony s Androidem. Služba mířila hlavně na zařízení s menší kapacitou úložiště a na regiony s pomalejším internetovým připojením.

NEJNOVĚJŠÍ

Nissan oživil legendu. Terrano se vrací jako drsný plug-in hybrid připravený do terénu

Japonská automobilka představila dvojici nových konceptů, mezi nimiž výrazně vyčnívá návrat jména Terrano. Robustní SUV s plug-in hybridním pohonem má ambice zamířit do sériové výroby už během příštího roku.

Některým lidem stačí 4 hodiny spánku. V čem spočívá jejich tajemství?

Představa, že někomu stačí jen pár hodin spánku, zní jako sen. Pro malou skupinu lidí je to ale realita. Takzvaní „krátcí spáči“ fungují plnohodnotně i se čtyřmi až šesti hodinami spánku denně, aniž by pociťovali únavu nebo zdravotní potíže.

Ulánbátar: Kde končí město a začíná Mongolsko

Na Mongolsko by bylo ideální mít týdny. Ale i krátká zastávka v Ulánbátaru dokáže ukázat kus země, kde se město rychle mění v otevřenou krajinu, beton v hory a ruch metropole v ticho u buddhistického chrámu.

Černobyl se čtyřicet let po havárii mění ve vojenské pásmo

Černobylská zóna zůstává jedním z nejznámějších symbolů jaderné katastrofy. Čtyřicet let po výbuchu reaktoru ale nese další vrstvu dějin. Místo opuštěných měst, zarůstajících domů a radioaktivní půdy se kvůli válce stalo také bezpečnostním pásmem, které má Ukrajina pod vojenskou kontrolou.

Diamantová liga výrazně zvyšuje prémie pro atlety

Atletická Diamantová liga vstupuje do nové éry. Organizátoři oznámili výrazné navýšení finančních odměn. Od roku 2025 se mezi sportovce rozdělí celkem 9,24 milionu dolarů. Jde o nejvyšší částku od vzniku seriálu v roce 2010.
Reklama
Reklama
Reklama