A Synthesia, az Nvidia óriáscég által támogatott brit cég nemrég mutatta be az „Expressive Avatars”-ot. Ez a fejlődés lehetővé teszi a mesterséges intelligencia (AI) alapú avatarok számára, hogy lenyűgöző pontossággal szimulálják az emberi érzelmeket és gesztusokat. Április 25-én jelent meg a hír, amely azt ígéri, hogy átalakítja a vállalati prezentációk, marketing és tréningek lebonyolítását.
A generatív mesterséges intelligencia technológia már akkor is ismert volt, hogy valósághű képeket és mozgásokat képes létrehozni. Ennek leghírhedtebb példája az OpenAI Sora videógenerátora. Ezek a technológiák azonban olyan kihívásokkal néztek szembe, mint a kéz- és végtagtorzulások, valamint a rossz ajakszinkron. A Synthesia úgy oldotta meg ezeket a problémákat, hogy megörökítette valódi emberek mozgását és megnyilvánulásait, akik a stúdiójában forgatókönyveket olvasnak, hogy hatékonyabban képezzék avatárjait.
Victor Ribarbelli, a Synthesia vezérigazgatója és társalapítója nyilatkozatában hangsúlyozta ennek az előrelépésnek a fontosságát: „az avatarok nem értik, amit mondanak”, ez a korlát, amelyet a legújabb technológiája igyekszik leküzdeni, lehetővé téve a hitelesebb arcreakciót érzelmek.
💥 Ez az. Ez mindent megváltoztat. 💥
A történelemben először, #AIavatars képesek megérteni, amit mondanak.
Az új mesterséges intelligencia avatarmodellünk, az EXPRESS-1 segítségével képesek érzékelni a szkript érzelmeit, és végrehajtani az emberi kommunikáció minden finom árnyalatát.
Az… pic.twitter.com/uj3WIjcGlm
— Szintézia 🎥 (@synthesiaIO) April 25, 2024
Az innováció nem csak a vizuális és érzelmi fejlesztésre korlátozódik. Az avatarok immár több mint 130 nyelvet támogatnak, automatikus feliratozást kínálnak, és még a felhasználók hangját is képesek reprodukálni. Bár minden nyelvi modell előrehaladást mutatott, az elvégzett tesztek szerint az angol modell az emberi kifejezésekhez való közelségével tűnik ki.
A mindössze hat éve piacon lévő Synthesia-ban már a Fortune 100 fele megbízik, és több mint 55.000 1 céget szolgál ki szerte a világon, köztük olyan neveket, mint a Zoom, a Xerox, a Microsoft és a Reuters. Az AI-megoldások iránti növekvő kereslet következtében a startup értékelése megközelítette az XNUMX milliárd dollárt, ami lenyűgöző mérföldkő a vállalat számára, és az iparágra gyakorolt hatásának bizonyítéka.