Synthesia, britská společnost podporovaná gigantem Nvidia, právě představila „Expressive Avatars“. Tento pokrok umožňuje avatarům založeným na umělé inteligenci (AI) simulovat lidské emoce a gesta s působivou přesností. Nová funkce byla odhalena 25. dubna a slibovala, že změní způsob, jakým jsou prováděny firemní prezentace, marketing a školení.
Generativní AI technologie byla již známá svou schopností vytvářet realistické obrazy a pohyby. Nejznámějším příkladem je videogenerátor Sora od OpenAI. Tyto technologie však čelily výzvám, jako jsou deformace rukou a končetin a špatná synchronizace rtů. Synthesia tyto problémy řešila zachycením pohybů a výrazů skutečných lidí, kteří v jejím studiu četli scénáře, aby efektivněji trénovali své avatary.
Victor Ribarbelli, generální ředitel a spoluzakladatel společnosti Synthesia, zdůraznil v prohlášení důležitost tohoto pokroku: „Avataři nerozumí tomu, co říkají“, což je omezení, které má nejnovější technologie překonat a umožňuje autentičtější reakci obličeje. emoce.
💥To je ono. Tím se vše mění. 💥
Poprvé v historii #AIavatars jsou schopni porozumět tomu, co říkají.
Díky našemu novému modelu avatarů AI, EXPRESS-1, dokážou detekovat sentiment skriptu a provádět všechny jemné nuance lidské komunikace.
— Synthesia 🎥 (@synthesiaIO) 25. dubna 2024
Inovace se neomezují pouze na vizuální a emocionální vylepšení. Avataři nyní podporují více než 130 jazyků, nabízejí automatické titulky a dokonce dokážou replikovat hlasy uživatelů. Ačkoli všechny jazykové modely prokázaly pokrok, anglický model se podle provedených testů vyznačuje blízkostí k lidským výrazům.
Synthesia, která je na trhu teprve šest let, již důvěřuje polovině žebříčku Fortune 100 a slouží více než 55.000 1 společnostem po celém světě, včetně jmen jako Zoom, Xerox, Microsoft a Reuters. S rostoucí poptávkou po řešeních umělé inteligence se jeho ocenění přiblížilo XNUMX miliardě dolarů, což je pro společnost působivý milník a důkaz jejího dopadu na průmysl.