Synthesia 是一家由巨头 Nvidia 支持的英国公司,刚刚推出了“Expressive Avatars”。这一进步使得基于人工智能 (AI) 的化身能够以令人印象深刻的准确性模拟人类情绪和手势。该新功能于 25 月 XNUMX 日发布,有望改变企业演示、营销和培训的方式。
生成式人工智能技术因其创建逼真图像和动作的能力而闻名。最臭名昭著的例子是 OpenAI 的 Sora 视频生成器。然而,这些技术面临着手部和肢体扭曲以及口型同步不佳等挑战。 Synthesia 通过捕捉真人的动作和表情来解决这些问题,真人在其工作室中阅读脚本,以更有效地训练其化身。
Synthesia 首席执行官兼联合创始人维克多·里巴贝利 (Victor Ribarbelli) 在一份声明中强调了这一进步的重要性:“化身不明白他们在说什么”,这是其最新技术旨在克服的一个限制,允许更真实的面部反应情绪。
💥就是这个了。这改变了一切。 💥
有史以来第一次, #AI头像 能够理解他们在说什么。
在我们新的 AI 化身模型 EXPRESS-1 的支持下,它们可以检测脚本的情绪并执行人类交流的所有细微差别。
该... pic.twitter.com/uj3WIjcGlm
— Synthesia 🎥 (@synthesiaIO) 2024 年 4 月 25 日
创新不仅仅局限于视觉和情感的增强。头像现在支持 130 多种语言,提供自动字幕,甚至可以复制用户的声音。尽管所有语言模型都显示出进步,但根据进行的测试,英语模型因其接近人类表达而脱颖而出。
Synthesia 上市仅六年,已受到一半财富 100 强企业的信赖,为全球超过 55.000 家公司提供服务,其中包括 Zoom、Xerox、微软和路透社等公司。随着对人工智能解决方案的需求不断增长,这家初创公司的估值接近 1 亿美元,这对公司来说是一个令人印象深刻的里程碑,也证明了其对行业的影响。